您的位置: 专家智库 > >

国家自然科学基金(60928005)

作品数:4 被引量:8H指数:2
相关作者:蔡莲红贾珈徐英进郑方孟凡博更多>>
相关机构:清华大学香港中文大学更多>>
发文基金:国家自然科学基金香港特区政府研究资助局资助项目国家重点基础研究发展计划更多>>
相关领域:电子电信自动化与计算机技术化学工程更多>>

文献类型

  • 5篇会议论文
  • 4篇期刊文章

领域

  • 4篇电子电信
  • 3篇语言文字
  • 2篇自动化与计算...
  • 1篇化学工程

主题

  • 4篇语音
  • 3篇语音合成
  • 3篇基频
  • 2篇英语
  • 2篇HMM
  • 1篇信息处理
  • 1篇言语
  • 1篇言语合成
  • 1篇言语识别
  • 1篇音高
  • 1篇语音转换
  • 1篇韵律结构
  • 1篇韵母
  • 1篇上下文
  • 1篇上下文信息
  • 1篇声学参数
  • 1篇声学特征
  • 1篇时长
  • 1篇双语
  • 1篇说话人

机构

  • 6篇清华大学
  • 1篇香港中文大学

作者

  • 5篇蔡莲红
  • 4篇贾珈
  • 2篇孟凡博
  • 1篇吴志勇
  • 1篇蒙美玲
  • 1篇徐英进
  • 1篇郑方
  • 1篇黄高扬

传媒

  • 1篇清华大学学报...
  • 1篇计算机工程
  • 1篇中文信息学报
  • 1篇Tsingh...

年份

  • 2篇2013
  • 2篇2012
  • 1篇2011
  • 4篇2010
4 条 记 录,以下是 1-9
排序方式:
Analysis of Chinese Interrogative Intonation and its Synthesis in HMM-Based Synthesis System
In the training process of HMM-based speech synthesis systems,the states of the HMM models are clustered based...
Yongxin Wang
关键词:INTONATION
言语信息处理的进展被引量:3
2011年
该文介绍了言语信息处理的进展,特别提到汉语言语处理的现状。言语信息处理涉及到言语识别、说话人识别、言语合成、言语知觉计算等。带口音和随意发音的言语识别有力的支持了语言学习与口语水平测评等应用;跨信道、环境噪音、多说话人、短语音、时变语音等因素存在的情况下提高识别正确率,是说话人识别的研究热点;言语合成主要关注多语言合成、情感言语合成、可视言语合成等;言语知觉计算开展了言语测听、噪声抑制算法、助听器频响补偿方法、语音信号增强算法等研究。将言语处理技术与语言、网络有效结合,促进了更加和谐的人机言语交互。
蔡莲红贾珈郑方
关键词:言语识别说话人识别言语合成
英语焦点重音声学参数分析与建模
本文针对英语焦点重音表达的特点,提出了一种从中性语音到含有焦点语音的转换方法。数据分析表明,中性语音到焦点语音各音节声学特征的变化与该音节与焦点的相对位置有关。因此以音节为单位,本文根据音节与焦点的相对位置,将焦点语音的...
孟凡博蒙美玲蔡莲红
关键词:基频时长
文献传递
基于LPC谱的汉语韵母感知度量的研究
语音信号的频谱分布在语言感知中具有关键作用。本文基于汉语韵母的频域特征,提出了一种韵母感知差异的度量方法。首先选取韵母的三个关键帧,然后计算三帧附近的平均LPC谱,进而计算特定频率段上的积分,以此作为每个韵母的特征向量。...
黄高扬贾珈蔡莲红
关键词:韵母听觉感知层次聚类
文献传递
Modeling Pitch Contour of Chinese Mandarin Sentences with the PENTA Model被引量:1
2012年
In continuous speech,the pitch contour of the same syllable may vary much due to its contextual information.The Parallel Encoding and Target Approximation (PENTA) model is applied here to Mandarin speech synthesis with a method to predict pitch contours for Chinese syllables with different contexts by combining the Classification And Regression Tree (CART) with the PENTA model to improve its prediction accuracy.CART was first used to cluster the syllables' normalized pitch contours according to the syllables contextual information and the distances between pitch contours.The average pitch contour was used to train the PENTA model with the average contour for each cluster.The initial pitch is required with the PENTA model to predict a continuous pitch contour.A Pitch Discontinuity Model (PDM) was used to predict the initial pitches at positions with voiceless consonants and prosodic boundaries.Initial tests on a Chinese four-syllable word corpus containing 2048 words were extended to tests with a continuous speech corpus containing 5445 sentences.The results are satisfactory in terms of the Root Mean Square Error (RMSE) comparing the predicted pitch contour with the original contour.This method can model pitch contours for Mandarin sentences with any text for speech synthesis.
Hui PangZhiyong WuLianhong Cai
关键词:音高上下文信息语音合成
基于HCSIPA的中英文混合语音合成被引量:4
2013年
基于双语说话人的中英文混合合成,提出一种中英文通用音标符号——HCSIPA,采用发音方式和部位为构造标准。在中英文混合聚类中,构造针对HCSIPA的中英文共用问题集,以提高中英文在决策树结构上的区分度。实验结果表明,HCSIPA能提高中文和英文的发音单元混合度,减少语言差距带来的音色差距,基于HCSIPA的混合合成系统可以合成较高质量的中英文语音,且中英文混合对单种语言合成的质量下降不明显。
徐英进蔡莲红
汉语音高模式及参数化描述的研究
汉语是声调语言,体现不同声调的基频复杂多变,而对于同声调的基频包络却有着许多相似。本文针对汉语单音节,研究汉语的音高模式及其参数化描述。通过分析汉语语音基频曲线的变化规律,从基频复杂的变化中归纳汉语四个声调的音高共性,提...
张章贾珈蔡莲红吴志勇
关键词:基频参数化
文献传递
基于决策树的英语焦点语音转换
2013年
焦点是语言表达的重要方式,焦点重音是重要的韵律特征,实现中性语音到焦点语音的转换可以提高语音的表现力。该文提出了声学特征局部凸显度的表示方法,分析了由中性语音到焦点语音,焦点单词所属音节声学特征变化与中性语音相应音节声学特征局部凸显度的相关性,提出了一种基于决策树的英语焦点语音的转换模型。该模型采用决策树对训练语料进行聚类,所用上下文包括音节与焦点单词的相对位置以及音节在韵律结构(如韵律短语、韵律词等)中的位置。在此基础上,提出了一种基于局部凸显度的中性语音到焦点语音声学特征变化的预测算法。采用该算法后,客观实验中声学特征变化平均绝对值误差降低到0.08,主观实验表明本文提出的模型的转换语音具有更好的焦点表达效果和自然度。
孟凡博吴志勇蒙美玲贾珈蔡莲红
关键词:语音转换声学特征韵律结构
语音合成自然度的客观度量实验研究
随着语音合成技术的发展,合成语音的音质和可懂度不断提高,而如何进一步提高其自然度成为语音合成方面的重要问题。本文总结了近年来主流的波形拼接式语音合成系统在自然度方面影响主观感受的四类问题,分析了它们对自然度主观感受的影响...
文献传递
共1页<1>
聚类工具0