您的位置: 专家智库 > >

蒙美玲

作品数:9 被引量:0H指数:0
供职机构:香港中文大学更多>>
发文基金:香港特区政府研究资助局资助项目国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:电子电信自动化与计算机技术语言文字文化科学更多>>

文献类型

  • 4篇专利
  • 2篇会议论文
  • 2篇科技成果
  • 1篇期刊文章

领域

  • 3篇电子电信
  • 2篇自动化与计算...
  • 1篇文化科学
  • 1篇语言文字

主题

  • 5篇语音
  • 4篇音素
  • 3篇声学特征
  • 2篇音色
  • 2篇音位
  • 2篇语音识别
  • 2篇声学
  • 2篇自动语音识别
  • 2篇字形
  • 2篇维特比
  • 2篇后验概率
  • 2篇和声
  • 2篇和声学
  • 2篇SUPPOR...
  • 2篇SYNTHE...
  • 2篇TECHNO...
  • 2篇CHINES...
  • 2篇ENGLIS...
  • 2篇EXPERI...
  • 1篇多模态

机构

  • 8篇香港中文大学
  • 2篇清华大学

作者

  • 9篇蒙美玲
  • 3篇吴志勇
  • 3篇蔡莲红
  • 3篇贾珈
  • 2篇徐英进
  • 2篇钟玉琢
  • 2篇王昊
  • 2篇孟凡博
  • 1篇王永鑫
  • 1篇王永鑫
  • 1篇宁辉
  • 1篇谢全辉
  • 1篇袁春
  • 1篇袁春
  • 1篇许佩瑜
  • 1篇黄嘉豪
  • 1篇黄嘉豪
  • 1篇李煜智
  • 1篇叶振兴
  • 1篇崔丹丹

传媒

  • 1篇清华大学学报...

年份

  • 1篇2022
  • 1篇2021
  • 1篇2019
  • 1篇2018
  • 1篇2013
  • 2篇2011
  • 1篇2009
  • 1篇2007
9 条 记 录,以下是 1-9
排序方式:
双语表现力语音合成与应用
吴志勇蔡莲红蒙美玲张申杨鸿武崔丹丹徐俊王永鑫宁辉黄嘉豪谢全辉贾珈孟凡博徐英进刘宇翔陶霖密袁春钟玉琢
该课题旨在进行汉语双语表现力合成语音的相关研究,并将其研究成果嵌入到多模态的口语对话系统中,从而进一步增进人机交互过程的和谐性,推动有表现力的可视语音合成技术的发展,为建立未来和谐人机语音交互环境提供理论基础和技术支持。...
关键词:
关键词:表现力可视语音合成
大会报告3 Development of Automatic Speech Recognition and Synthesis Technologies to Support Chinese Learners of English:The CUHK Experience
蒙美玲
Development of Automatic Speech Recognition and Synthesis Technologies to Support Chinese Learners of English: The CUHK Experience
蒙美玲
用于计算机辅助发音训练和语音处理的声学字形模型和声学字形音位模型
介绍了一种用于以音素级分析语音的声学字形模型(AGM)和声学字形音位模型(AGPM)。AGM是多分布深度神经网络(MD‑DNN),其输入包括话语的声学特征的表示和文本的对应字形转录。AGPM的输入可以包括声学特征、字形转...
蒙美玲李坤孙立发吴锡欣
文献传递
多模态、多语种的语音、语言交互的研究与应用
蒙美玲蔡莲红吴志勇张申杨鸿武黄嘉豪崔丹丹曹光琦徐俊许佩瑜叶振兴贾珈王永鑫李煜智孟凡博卢伟杰徐英进陶霖密袁春钟玉琢刘宇翔
本项目属于计算机人机语言交互领域,针对多语种多模态言语交互,主要研究语言的分析与理解、表现力可视语音合成、口语对话等技术与应用。  主要科技内容如下:  1.建立了支持多语种统一的语言、语音处理框架,实现了自然语言处理与...
关键词:
关键词:多语种多模态
基于语音后验概率的多对一语音转换方法
一种使用语音后验概率(PPG)实现音色转换的方法。首先,从目标说话者的语音中,使用与说话者无关的自动语音识别(SI‑ASR)系统来提取PPG。提取到的PPG用作映射不同的说话者之间的关系。PPG包括与时间范围和语音类别范...
孙立发李坤王昊康世胤蒙美玲
用于计算机辅助发音训练和语音处理的声学字形模型和声学字形音位模型
介绍了一种用于以音素级分析语音的声学字形模型(AGM)和声学字形音位模型(AGPM)。AGM是多分布深度神经网络(MD‑DNN),其输入包括话语的声学特征的表示和文本的对应字形转录。AGPM的输入可以包括声学特征、字形转...
蒙美玲李坤孙立发吴锡欣
基于决策树的英语焦点语音转换
2013年
焦点是语言表达的重要方式,焦点重音是重要的韵律特征,实现中性语音到焦点语音的转换可以提高语音的表现力。该文提出了声学特征局部凸显度的表示方法,分析了由中性语音到焦点语音,焦点单词所属音节声学特征变化与中性语音相应音节声学特征局部凸显度的相关性,提出了一种基于决策树的英语焦点语音的转换模型。该模型采用决策树对训练语料进行聚类,所用上下文包括音节与焦点单词的相对位置以及音节在韵律结构(如韵律短语、韵律词等)中的位置。在此基础上,提出了一种基于局部凸显度的中性语音到焦点语音声学特征变化的预测算法。采用该算法后,客观实验中声学特征变化平均绝对值误差降低到0.08,主观实验表明本文提出的模型的转换语音具有更好的焦点表达效果和自然度。
孟凡博吴志勇蒙美玲贾珈蔡莲红
关键词:语音转换声学特征韵律结构
基于语音后验概率的多对一语音转换方法
一种使用语音后验概率(PPG)实现音色转换的方法。首先,从目标说话者的语音中,使用与说话者无关的自动语音识别(SI‑ASR)系统来提取PPG。提取到的PPG用作映射不同的说话者之间的关系。PPG包括与时间范围和语音类别范...
孙立发李坤王昊康世胤蒙美玲
文献传递
共1页<1>
聚类工具0