您的位置: 专家智库 > >

国家自然科学基金(60575032)

作品数:6 被引量:42H指数:4
相关作者:陶建华黄力行康永国辛乐赵礼悦更多>>
相关机构:中国科学院自动化研究所中国科学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信理学更多>>

文献类型

  • 6篇期刊文章
  • 5篇会议论文

领域

  • 8篇自动化与计算...
  • 2篇电子电信
  • 1篇理学

主题

  • 6篇语音
  • 4篇语音合成
  • 2篇隐马尔可夫模...
  • 2篇自适
  • 2篇自适应
  • 2篇自适应权重
  • 2篇马尔可夫
  • 2篇马尔可夫模型
  • 2篇HTS
  • 1篇倒装
  • 1篇多音字
  • 1篇信息处理
  • 1篇性能指标
  • 1篇映射
  • 1篇映射模型
  • 1篇映射算法
  • 1篇语音处理
  • 1篇语音转换
  • 1篇韵律短语
  • 1篇真实感

机构

  • 10篇中国科学院自...
  • 1篇中国科学院

作者

  • 8篇陶建华
  • 4篇黄力行
  • 3篇于剑
  • 1篇赵礼悦
  • 1篇刘方舟
  • 1篇穆凯辉
  • 1篇张蒙
  • 1篇周密
  • 1篇董宏辉
  • 1篇陈益强
  • 1篇康永国
  • 1篇徐波
  • 1篇辛乐
  • 1篇辛乐

传媒

  • 3篇第九届全国人...
  • 2篇清华大学学报...
  • 1篇声学学报
  • 1篇系统仿真学报
  • 1篇中文信息学报
  • 1篇计算机与数字...
  • 1篇第十三届全国...

年份

  • 1篇2010
  • 3篇2008
  • 6篇2007
  • 1篇2006
6 条 记 录,以下是 1-10
排序方式:
汉语对话语气韵律建模方法的研究
本文构建了一个普通话对话语气韵律模型。在构建该对话语气韵律模型的过程中,本文借鉴了现有陈述语气韵律模型的研究成果,同时针对对话语气所独有的特点对其进行了扩展。与陈述语气相比,对话语气最明显的特点在于其具有较快的语速和较窄...
于剑黄力行陶建华
关键词:语音合成
文献传递
基于最大熵模型的多音字消歧
字音转换是语音合成系统必不可少的模块,而多音字消歧则是字音转换的核心问题。本文选择了33个常见常错的多音字作为研究对象,使用最大熵模型来辨析多音字的读音。在特征选择方面,本文比较了不同领域的多种关键词选择的方法,采用似然...
刘方舟施勤陶建华
关键词:字音转换多音字最大熵模型决策树
文献传递
一种混合使用连续HMM和离散HMM的HTS合成系统
传统的基于隐马尔可夫模型(HMM)的语音合成系统(HTS)存在两个问题,分别是时域的过平滑问题和频域的过平滑问题。为了解决这两个问题,本文提出了一种同时利用连续隐马尔可夫模型和离散隐马尔可夫模型的合成系统框架。传统的HT...
于剑张蒙陶建华王霞
关键词:语音合成隐马尔可夫模型语音处理
文献传递
基于混合映射模型的语音转换算法研究被引量:16
2006年
分析了语音转换研究中使用高斯混合模型映射算法时转换特征出现过平滑的问题,认为协方差矩阵估计不准确导致的转换特征细节信息的丢失是产生过平滑问题的主要原因,提出了使用码本映射和高斯混合模型共同转换声学特征细节的混合映射算法。此外提出了利用音素信息进行快速高斯混合模型训练的训练方法。客观评价表明使用音素信息的训练方法比常规方法性能指标平均提高了12.87%,而混合映射算法在使用音素信息的训练方法基础上比传统高斯混合模型转换算法性能指标提高了27.13%
康永国双志伟陶建华张维
关键词:高斯混合模型映射模型语音转换映射算法性能指标
基于约束模型的韵律短语预测被引量:7
2007年
本文提出了基于语法约束和长度约束的韵律短语预测模型。在语法约束模型中,我们引入了组块作为基本的节律分析单元。韵律短语的长度约束模型是利用隐马尔科夫模型对语句中韵律短语的长度规划进行建模,这个模型对短语的长度分布及韵律词与韵律短语的关系进行了描述。最后,利用一个称为k-候选的方法来融合这两个约束模型。整个方法充分利用了韵律短语的语法约束和长度约束,并将之有机地结合起来。试验表明,该预测模型达到了很好的效果,韵律短语边界识别的调和平均值达到82.9%。
董宏辉陶建华徐波
关键词:计算机应用中文信息处理韵律短语
自适应权重的双模态情感识别被引量:10
2008年
情感识别是人机交互领域的重要问题之一。语音和脸部肌肉动作信息是用于情感识别的2个最重要的模态。该文认为,在双模态情感识别中,给不同的特征赋予不同的权值有利于充分利用双模态信息,提出了一种基于Boosting算法的双模态信息融合方法,它能够自适应地调整语音和人脸动作特征参数的权重,从而达到更好的识别效果。实验表明,该方法能够更好地区分易混淆的情感状态,情感识别率达84%以上。
黄力行辛乐赵礼悦陶建华
关键词:BOOSTING算法自适应权重
汉语对话语气韵律建模方法被引量:3
2008年
为使得合成系统所生成的语音更加自然,构建了一个普通话对话语气韵律模型。借鉴现有陈述语气韵律模型的研究成果,针对对话语气的特点进行扩展,生成具有对话语气韵律特征的基频曲线。与陈述语气相比,对话语气具有较快的语速和较窄的调域,然而仅通过变换语速和调域却无法模拟出对话语气的特征。对话语气中音节内部基频曲线无法完成其原先固有的调形,这种现象称为"未完成现象"。为了模拟这种现象,利用分类树预测一个音节是正常音节还是未完成音节,并在基频曲线生成模型中对未完成音节进行特殊处理,使之生成具有对话语气韵律特征的基频曲线。听辨实验证明,基于本文所提出韵律模型合成的语音表现更加自然和口语化。
于剑黄力行陶建华
关键词:语音合成
自然手语动作序列生成的研究被引量:6
2010年
文章探讨了如何让在手语新闻播报中的卡通人按照自然手语的语法规则而非正常人的语法规则来打手语。首先整理了现代汉语自然手语的规则并将其形式化,并建立了正常汉语到汉语自然手语转换的形式规则库;从而实现了现代汉语文本到相应的自然手语的手语动作序列的自动生成。最后将其嵌入到通过手语合成技术和卡通动画的手语新闻播报系统中,使其在线输出的是符合聋人习惯的自然手语。
范双南陈益强周经野
关键词:自然手语倒装省略
基于动态基元选取的真实感可视语音合成系统
2008年
伴有说话者面部表情及唇动的文本-可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感。结合当前主要的两类TTVS技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前提下,以较小的数据量,获得了较为生动的效果,形成了具有较高真实感的中文可视语音合成系统。
周密穆凯辉陶建华
关键词:可视语音MPEG-4
自适应权重的双模态情感识别
情感识别是人机交互领域的重要问题之一。语音和脸部肌肉动作信息是用于情感识别的两个最重要的模态。本文认为,在双模态情感识别中,给不同的特征赋予不同的权值有利于充分利用双模态信息,并且提出了一种基于Boosting的双模态信...
黄力行辛乐赵礼悦陶建华
关键词:BOOSTING自适应权重
文献传递
共2页<12>
聚类工具0