国家自然科学基金(60172055)
- 作品数:4 被引量:7H指数:1
- 相关作者:刘文举刘文举阮晓钢康恒左国玉更多>>
- 相关机构:中国科学院自动化研究所北京工业大学更多>>
- 发文基金:国家自然科学基金北京市自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 分段模型在解码假设检验中的应用
- 2004年
- 本文主要研究了分段模型 (以参数轨迹模型为例 )在解码假设检验中的应用。分段模型与传统的HMM相比 ,具有更加精确的建模能力。多年来人们一直致力于研究它对语音识别性能的提高 ,而忽视了其它方面的应用。本文提出了分段模型校验的方法 ,对HMM的识别结果进行二次处理 ,克服了传统方法在不同句子间不具有可比性的缺点 ,简单而有效 ;在此基础上 ,为了满足系统的特殊要求 ,训练Fisher分类器 ,选择分段模型而非HMM的N Best信息作为特征输入 ,验证了分段模型得分作为可信度指标时的优秀区分能力。实验结果表明 ,在第一类错误率为 5 %的情况下 ,最好的第二类错误率可以降到 2 5 2 6 5 %。这体现了系统良好的拒识性能。
- 张翼燕刘文举徐波
- 关键词:人工智能自然语言处理
- 基于发音稳定段的自适应步长段模型解码及其在LVCSR中的应用
- 本文提出了一种基于发音稳定段的自适应步长段模型解码方法,并将其应用于大词汇量汉语连续语音识别系统中。该方法首先利用语音信号的频谱能量构建特征向量,并用统计分类工具检测出发音稳定段;随后在语音识别阶段,不再对起始帧或终止帧...
- 张华刘文举徐波
- 关键词:语音识别语音信号分析高斯混合模型
- 文献传递
- 一种新的基于匹配的语音合成基元选取算法
- 本文提出了一种新的基元选择算法,目的是解决如何利用一规模较小的汉语语音库,选择出较好的语音合成基元.这种方法结合了传统的拼接单元选择方法,同时充分地利用了基元所在语句上下文的信息,最终选择出最优合成基元.从最后的实验结果...
- 祝韶晖刘文举吴玺宏
- 文献传递
- 基于信号处理的电话语音模拟被引量:1
- 2003年
- 针对电话语料比较缺乏的问题,提出了一种完全由软件模拟实现由纯净语音向电话质量语音转换的算法。该算法采用滤波器设计技术来模拟电话线路连接中各种模拟传输设备频率响应特性,并对电话通道环境中各种噪音行为等电话语音现象进行了模拟研究。频谱失真分析和识别实验结果表明,通过模型参数的合理设置和调整,该算法能有效地实现纯净语音向电话质量语音的近似模拟,使用由纯净数据生成的模拟语音可以获得与真实语音同等的识别性能。
- 左国玉刘文举阮晓钢
- 关键词:信号处理滤波器语音识别
- Sinusoidal+All-Pole Modification Based Spectral Smoothing for Concatenative Speech Synthesis
- <正>The conventional LPC spectral smoothing algorithm causes an evident degradation in the speech quality when ...
- Heng KANG
- 文献传递
- 基于数据模拟和HMM自适应的电话语音识别研究被引量:1
- 2003年
- 该文研究了基于数据模拟方法和HMM(隐马尔科夫模型)自适应的电话信道条件下语音识别问题。模拟数据模仿了纯净语音在不同电话信道条件下的语音行为。各基线系统的HMM模型分别由纯净语音和模拟语音训练而成。语音识别实验评估了各基线系统HMM模型在采用MLLR算法(最大似然线性回归)做无监督式自适应前后的识别性能。实验证明,由纯净语音转换生成的模拟语音有效地减小了训练语音和测试语音声学性质的不匹配,很大程度上提高了电话语音识别率。基线模型的自适应结果显示模拟数据的自适应性能比纯净语音自适应的性能最大提高达到9.8%,表明了电话语音识别性能的进一步改善和系统稳健性的提高。
- 左国玉刘文举阮晓钢
- 关键词:电话语音识别
- 语音识别段分布模型建模方法特性分析
- 混合密度多项式段模型(Mixture Density PolynomialSegment Models)MDPSM在语音段内利用时变轨迹的概念,准确地描述了特征矢量的动态特性.它的模型参数包括均值轨迹矩阵、残差矩阵和混合...
- 张翼燕刘文举徐波
- 文献传递
- 基于综合因素的汉语连续语音库语料自动选取被引量:5
- 2003年
- 大词汇量连续语音识别系统的性能很大程度上取决于语音库的质量 ,而语音库设计的中心环节就是语料选取。但是传统语料选取方法往往考虑因素单一 ,不利于语音识别系统有效利用语言信息。本语音库的语料选取方法综合考虑了多种因素 :三音子覆盖率、三音子覆盖效率、三音子稀疏度、常用词分布等 ,并完全实现程序自动选取 ,充分利用了原始语料 ,使选取结果的信息量更加丰富。程序自动选取结果可以覆盖94 1%的三音子 ,75 4 %的最常用词 ,覆盖效率和稀疏度也比传统方法有了较大改善。
- 康恒刘文举
- 关键词:语音识别系统稀疏度三音子高频词