您的位置: 专家智库 > >

国家自然科学基金(90820303)

作品数:13 被引量:23H指数:3
相关作者:陶建华李雅刘文举许小颖卢颖超更多>>
相关机构:中国科学院自动化研究所中国科学院北京师范大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:电子电信自动化与计算机技术语言文字交通运输工程更多>>

文献类型

  • 12篇期刊文章
  • 9篇会议论文

领域

  • 10篇自动化与计算...
  • 9篇电子电信
  • 6篇语言文字
  • 1篇机械工程
  • 1篇交通运输工程

主题

  • 5篇语音
  • 5篇重音
  • 3篇语流
  • 3篇韵律
  • 3篇连续语流
  • 2篇对话管理
  • 2篇言教
  • 2篇音节
  • 2篇英语
  • 2篇英语口语
  • 2篇语料
  • 2篇语料库
  • 2篇语料库建设
  • 2篇语言
  • 2篇语言教学
  • 2篇语音合成
  • 2篇语音识别
  • 2篇声学模型
  • 2篇手语
  • 2篇手语合成

机构

  • 16篇中国科学院自...
  • 4篇中国科学院
  • 3篇北京师范大学
  • 2篇北京语言大学
  • 1篇河南理工大学
  • 1篇湘潭大学
  • 1篇三明学院
  • 1篇中国科学院研...

作者

  • 7篇陶建华
  • 6篇李雅
  • 3篇卢颖超
  • 3篇于东
  • 3篇徐波
  • 3篇贾磊
  • 2篇李宏言
  • 2篇许小颖
  • 2篇刘文举
  • 2篇陈益强
  • 2篇王士进
  • 2篇潘诗锋
  • 1篇柯登峰
  • 1篇廖逢钗
  • 1篇杨明浩
  • 1篇刘军发
  • 1篇叶军涛
  • 1篇彭星源
  • 1篇杨占磊
  • 1篇黄申

传媒

  • 5篇清华大学学报...
  • 2篇Chines...
  • 1篇声学学报
  • 1篇计算机研究与...
  • 1篇计算机应用
  • 1篇机器人
  • 1篇信号处理

年份

  • 4篇2013
  • 3篇2012
  • 12篇2011
  • 1篇2010
  • 1篇2009
13 条 记 录,以下是 1-10
排序方式:
Integrating induced probability into decoding for large vocabulary continuous speech recognition被引量:2
2012年
This paper integrates location information of frames into conventional acoustic model(AM)and language model(LM)likelihoods,in order to distinguish potential path candidates more precisely at decoding stage.This paper proposes an induced probability,which represents location information of frames within the whole acoustic space.By integrating the induced probability,the decoder is directed to search within the most promising regions of acoustic space.Promising paths are enhanced and unlikely paths are weakened.Experiments conducted on Chinese Putonghua show that the character error rate is reduced by 10.95%relatively without increasing decoding complexity significantly.Finally,pruning analysis shows that integrating location information of frames into traditional decoding framework is helpful for improving system performance.
YANG Zhanlei LIU Wenju CHAO Hao
关键词:连续语音识别大词汇量声学模型
A signal subspace dimension estimator based on F-norm with application to subspace-based multi-channel speech enhancement被引量:2
2012年
Although the signal subspace approach has been studied extensively for speech enhancement,no good solution has been found to identify signal subspace dimension in multichannel situation.This paper presents a signal subspace dimension estimator based on F-norm of correlation matrix,with which subspace-based multi-channel speech enhancement is robust to adverse acoustic environments such as room reverberation and low input signal to noise ratio (SNR).Experiments demonstrate the presented method leads to more noise reduction and less speech distortion comparing with traditional methods.
LI Chao LIU Wenju
关键词:信号子空间维数估计
英语口语重复修正检错中语法网络和搜索过滤算法
针对口语重复修正检错这一计算机辅助语言教学中的难点,提出一种基于音节单元WFST(weighted finite-state transducer)网络的容错对齐和搜索过滤算法。该算法将对齐后识别结果中邻近匹配词所对应的...
黄申李宏言王士进徐波
关键词:计算机辅助语言教学流利度
文献传递
连续语流中重音标注和大规模重音语料库建设
规范的重音标注将对重音研究和语音合成技术产生积极影响。该文通过对大规模语料进行语流中词重音和句重音标注,总结出了重音标注的规则。重音标注包括标注训练、正式标注、语料库建立3个步骤。通过标注训练明确重音概念和标注方法,词重...
卢颖超李雅陶建华许小颖
文献传递
基于X光的汉语单音节舌位轮廓运动数据库
尽管目前出现了很多面向发音器官病理诊治和观测的医学设备,X光图像序列作为一种有效的发音器官运动的观测手段,对于发音病理分析和嗓音诊治依然不可或缺。本研究建立了一个X光的汉语单音节女性的发音舌位运动轮廓数据库,该数据库包含...
杨明浩陶建华张大伟李昊
采用重音调整模型的HMM语音合成系统被引量:2
2011年
韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hid-den Markov model,HMM)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的HMM模型,最后采用基于隐Markov模型的语音合成技术(hidden Markov modelbased speech synthesis,HTS)系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活地扩展到对其他语音表现力的合成。
李雅潘诗锋陶建华
关键词:重音语音合成韵律
面向语音识别错误恢复的澄清式人机对话系统
2011年
在人机交互系统中,自动语音识别(ASR)错误将导致交互障碍,通过发起澄清式人机对话可以实现ASR错误恢复。该文提出澄清式人机对话系统结构,用于实现语音识别错误恢复,实现了系统的4个组成部分:ASR错误检测、基于统计机器翻译(SMT)方法的澄清式疑问句生成模型、说话人响应分析、基于有限状态机(FSM)的对话管理模型。各模块均采用与特定任务无关的方法建立。实验结果表明:澄清式人机对话系统可以有效模拟口语中的澄清现象,在不同的错误环境中能够较好的实现ASR错误恢复任务。
于东贾磊徐波
关键词:对话管理
面向窄带通信的极低速率语音编码算法研究被引量:1
2013年
提出了一种面向窄带通信的极低速率参数语音编码算法。在2.4kbps MELP标准的基础上结合听觉感知,对线谱对参数进行联合矢量量化、对基音周期进行内插和非线性量化、对能量参数进行高效压缩,可以使语音数据在0.5kbps下匀速传输;线谱对参数的预测残差用于矢量量化,这是一种提高合成语音的音质的有效方法。实验结果表明,采用本文提出的语音编码算法可以使语音数据在极低码率下有效的传输,解码端合成的语音具有较高的可懂度。
刘斌陶建华莫福源
关键词:听觉感知
连续语流中韵律层级和调型组合对重音感知的影响被引量:3
2011年
由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为:1)随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。
李雅卢颖超许小颖陶建华
关键词:重音感知韵律
面向语音识别错误恢复的澄清式疑问句生成
人机对话系统中的语音识别错误将导致人机交互障碍。通过发起澄清式疑问是实现语音识别错误恢复的新思路。本文研究了澄清式疑问句生成问题,建立了人工标注的澄清疑问数据库,提出基于SVM分类器的截取模型和对齐泛化短语模型两种方法为...
于东贾磊徐波
关键词:SVM分类器
文献传递
共3页<123>
聚类工具0