您的位置: 专家智库 > >

宋黎明

作品数:2 被引量:10H指数:2
供职机构:中国科学院声学研究所更多>>
发文基金:中国科学院战略性先导科技专项国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 1篇电子电信
  • 1篇自动化与计算...

主题

  • 2篇语音
  • 1篇信号
  • 1篇隐马尔科夫模...
  • 1篇语音识别
  • 1篇语音信号
  • 1篇神经网
  • 1篇神经网络
  • 1篇神经网络技术
  • 1篇声学建模
  • 1篇谐波
  • 1篇马尔科夫
  • 1篇马尔科夫模型
  • 1篇抗噪
  • 1篇抗噪性
  • 1篇抗噪性能
  • 1篇基频
  • 1篇基音
  • 1篇基音检测
  • 1篇基音周期
  • 1篇汉语语音识别

机构

  • 2篇中国科学院

作者

  • 2篇宋黎明
  • 2篇颜永红
  • 1篇张晴晴
  • 1篇潘接林
  • 1篇李明

传媒

  • 1篇声学学报
  • 1篇重庆邮电大学...

年份

  • 1篇2015
  • 1篇2014
2 条 记 录,以下是 1-2
排序方式:
谐波显著度的基频提取方法被引量:5
2015年
我们提出的谐波显著度的基频提取方法,目的是从语音信号中自动获取人声基频,该方法利用抑制因子计算出基频的谐波显著度谱,对各次谐波显著度加权求和之后进行基频轨迹跟踪确定语音的基频序列。在TIMIT掺噪数据集和音乐信息检索评测2005主旋律数据集上,谐波显著度方法的准确率分别达到了88.5%和73.3%,使倍频、半频错误相对降低了80%。实验表明,基于谐波显著度的基频提取方法增强了系统的抗噪性能以及抗倍半频错误的能力。
宋黎明李明颜永红
关键词:语音信号基音周期抗噪性能基音检测
深度神经网络技术在汉语语音识别声学建模中的优化策略被引量:5
2014年
将深度神经网络作为声学模型引入面向汉语电话自然口语交谈语音识别系统。针对自然口语中识别字错误率较高的问题,从语音的声学特征类型选择、模型训练时元参数调节以及改善模型泛化能力等方面出发,对基于深度神经网络的声学模型建模技术进行了一系列的优化。针对训练样本中状态先验概率分布稀疏的情况,提出了一种状态先验概率平滑算法,在一定程度上缓解了这种数据稀疏问题,经平滑后,字错误率下降超过1%。在所采用的3个电话自然口语交谈测试集上,相对于优化前的深度神经网络模型,经过优化后的模型取得了性能的一致提升,字错误率平均相对降低15%。实验结果表明,所采用优化策略可以有效地改善深度神经网络声学模型性能。
肖业鸣张晴晴宋黎明潘接林颜永红
关键词:语音识别隐马尔科夫模型
共1页<1>
聚类工具0