钱彦旻
- 作品数:6 被引量:11H指数:2
- 供职机构:清华大学电子工程系更多>>
- 发文基金:国家自然科学基金国家科技支撑计划国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 嵌入式系统的汉英双语语音识别方法
- 本发明属于语音识别技术领域,尤其涉及一种嵌入式系统的汉英双语语音识别方法。包括A/D采样及采样后语音的预加重,提高高频信号的能量,加窗分帧处理以及语音特征参数的提取,并根据预先建立的声学模型,进行语音命令的匹配识别;其中...
- 刘加钱彦旻
- 文献传递
- 嵌入式系统的汉英双语语音识别方法
- 本发明属于语音识别技术领域,尤其涉及一种嵌入式系统的汉英双语语音识别方法。包括A/D采样及采样后语音的预加重,提高高频信号的能量,加窗分帧处理以及语音特征参数的提取,并根据预先建立的声学模型,进行语音命令的匹配识别;其中...
- 刘加钱彦旻
- 嵌入式平台大词汇量语音命令词的识别方法
- 本发明公开了语音识别技术领域中的一种嵌入式平台大词汇量语音命令词的识别方法。包括下列步骤:语音信号的预处理和语音识别参数的提取、建立语音声学模型并进行语音模型训练、构建树形识别网络、应用快速识别搜索算法;其中,语音声学模...
- 刘加钱彦旻
- 文献传递
- 基于优化检测网络和MLP特征改进发音错误检测的方法被引量:2
- 2012年
- 该文基于优化的检测网络和多层感知(multi-layerperception,MLP)特征,提出一种可以更加准确地检测出错误发音类型的方法。首先,从第二语言学习的语音库中提取出基本的发音规则以及组合的发音规则,并相应地计算它们发生的先验概率,再将这些具有先验概率的规则用于构建基于多发音的扩展检测网络。然后在检测过程中,引入基于发音特征的MLP特征来描述发音概率,替代了传统的语音声学特征。最后使用基于MLP特征的GMM-HMM框架从检测网络中识别出最可能的发音音素串。实验表明:该方法将音素识别正确率提高了3.11%,错误类型准确率提高了7.42%。
- 袁桦钱彦旻赵军红刘加
- 关键词:发音错误检测发音规则发音特征
- 基于交叉熵顺序统计滤波的语音端点检测算法被引量:7
- 2009年
- 为提高语音端点检测在强噪声环境下的准确率,提出了一种基于交叉熵顺序统计滤波(OSF)的语音端点检测算法。该算法以子带交叉熵为语音/非语音的区分特征,首先将每帧语音的频谱划分成若干个子带,估计出每个子带能量与背景噪声之间的交叉熵,然后把相继若干帧的子带能量交叉熵经过一组顺序统计滤波器,最后根据各帧交叉熵的值对输入的语音进行分类。实验结果表明:该算法能够有效地区分语音和非语音。特别是在强噪声环境下依然能够保持很高的检测率,具有鲁棒性。通过实验结果比较,该算法在性能上优于最近提出的基于能量顺序统计滤波和单纯交叉熵判别的两种方法。
- 钱彦旻刘加
- 关键词:语音信号处理端点检测
- 低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模被引量:2
- 2013年
- 为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,提出了基于句子后验概率的置信度数据筛选准则,所选数据在保证整句话可靠性的同时很好保留了上下文信息,有利于跨词的三音子声学模型建模;还提出了基于音素覆盖率准则的数据筛选方法,在考虑假设标注句子置信可靠度的同时,尽可能选取训练样本中最为稀疏的音素单元,从源头再次克服低数据资源的困难,数据选择效率更高,性能进一步提升。实验表明:基于本文改进的无监督训练方法的词错误率比基线有监督训练方法的降低约相对8%,比传统无监督方法的也有绝对2%的减少,极大程度改善了低数据资源条件下的系统性能。
- 钱彦旻刘加
- 关键词:语音识别数据选择