国家自然科学基金(60275014) 作品数:16 被引量:147 H指数:5 相关作者: 蔡莲红 黄德智 吴志勇 刘涛 张晓洲 更多>> 相关机构: 清华大学 西北师范大学 法国电信 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 理学 更多>>
近红外漫反射光谱法和模式识别技术鉴别中药材产地 被引量:92 2006年 采用近红外漫反射光谱法获得了来自不同产地的中药材的红外光谱,结合近邻法和多类支持向量机等模式识别技术,对来自四个不同产地的269个白芷样本和六个不同产地的350个野生和栽培丹参样本进行了产域鉴别,得到的交叉验证准确率分别达到99%和95%,为中药材产地的快速无损鉴别探索了一条有效的途径。 刘沭华 张学工 周群 孙素琴关键词:近红外光谱 模式识别 中药材鉴别 语音合成中基于听辨指导的权重训练算法 被引量:4 2005年 针对语音合成的基元选取中权重设定的问题提出了一种基于人工听辨指导的权重自动训练的方法。该方法首先通过人工听辨对现有的基元选取结果进行评测打分,然后采取韵律逼近的方法对人工评测的结果进行学习,进而对权重进行调整修正,从而实现权重的自动训练。实验表明:该方法较好地解决了权重设定的问题,使得合成语音的自然度听辨得分由3.49提高到4.02。同时,该方法还使得语音合成系统在使用过程中根据用户反馈自动进行优化成为可能。 吴志勇 蔡莲红 蔡锐关键词:语音合成 文语转换 基于基频包络的音节聚类研究 被引量:2 2004年 对汉语 TTS系统的大规模语料库做了基本的韵律参数统计 ,分析了音节的韵律特征与其所在的韵律结构位置以及韵律结构边界的关系 .进一步 ,对有调音节样本集基于基频包络采用 k中心点算法进行聚类 ,通过听辨实验检验了聚类结果 。 刘涛 蔡莲红关键词:语音合成 一种面向声音变换的参数化模型 被引量:2 2006年 在源滤波器模型的基础上,利用统计学习方法,建立了一种面向声音变换的混合参数化模型。该模型包括浊音声学模型、清音声学模型和韵律补偿模型三部分。基于线性预测分析和mel倒谱分析的浊音声学模型,刻画了说话人声腔的共振特性。基于线性预测分析和噪声源分析的清音声学模型,反映了说话人发清音的特点。基于统计学习方法的韵律补偿模型描述了音高、能量与时长等分布特性。在该混合参数化模型的基础上,提出了一个声音变换算法,并将其应用到汉语音节的变换问题上。实验结果表明,对清浊音和韵律特性分别建模的变换算法能够提高重建语音的清晰度和可懂度,缩小重建语音与目标语音之间的感知距离,使重建语音具有目标说话人的韵律特征. 黄德智 蔡莲红关键词:声音 统计学习方法 汉语音节 声学模型 韵律特征 考虑帧间动态特征的音色变换算法 被引量:2 2006年 基于G auss ian混合模型的音色变换算法在预测目标说话人频谱时会出现过平滑问题,导致声音转换结果的音质下降。该文分析了造成过平滑问题的原因,并提出一种考虑帧间动态特征的音色变换改进算法,在估计参数的目标函数中加入了连续性和方差的影响,从而改善了映射结果的帧间连续性,并使方差最大化,克服了过平滑现象。实验表明该算法在保证变换结果的目标倾向性的同时,能够使变换语音的音质主观意见得分由3.11提高到3.89,证明动态特征对提高音色变换的音质有重要意义。 张晓洲 黄德智 蔡莲红关键词:动态特征 合成语音自然度客观测度 被引量:6 2005年 目前合成语音的自然度有待提高,论文根据目前的研究现状提出了一种合成语音自然度的客观评价方法,该方法主要从语音韵律特征的主要参数出发,计算同一发音人的自然语音和合成语音之间的基频、时长、音强等参数的差距,其中由于两种语音基频时间不匹配,所以采用DTW(Dynamic Time Warping)算法来对两种语音的基频进行了时间弯折对准。最后再将计算结果与主观评测(MOS)的结果进行比较。实验数据表明,论文提出的基频曲线失真测度与MOS之间具有很强的相关性,从韵律特征角度给出的评价结果能够衡量合成语音的自然度。 赵博 蔡莲红关键词:语音合成 评测 一种基于声调规范模型的声调变换方法 被引量:4 2005年 该文利用固定点频率分析提取基音频率(F0),建立归一化线性多项式声调模型。参考男声、女声基音频率的分布和五度标调法,提出了一套汉语声调的规范模型,在此规范模型的基础上,实现了汉语语音声调变换。实际测听表明,经此模型变换的声音达到预期效果。 薛健 蔡莲红一种新的基于规则的多音字自动注音方法 本文统计了大量正确标音的语料,结果表明220个多音字的出现频度占总频度的99%以上。本文针对这220个多音字,提出了一种新的基于规则的多音字自动注音的方法。该方法首先对语句中的多音字进行预分类,然后基于8项特征提取规则,... 郑敏 蔡莲红关键词:字音转换 多音字 韵律短语 特征提取 文献传递 带有频谱补偿的基频修改算法 被引量:1 2004年 针对当前多数在基于拼接的语音合成系统中使用的基频修改算法缺少对频谱进行补偿的情况,提出了一种带有频谱补偿的基频修改算法。在传统基音同步叠加(PSOLA)算法的基础上,以共振峰参数和频谱倾斜参数描述频谱特性,通过对频谱参数进行预测及修改,在修改基频的同时,有效地补偿了频谱特性。频谱参数的预测公式由各基频下的条件概率密度函数导出,频谱参数的修改通过正弦模型实现。实验表明,对于不同的汉语元音、基频修改因子和听者,在平均86.25%的情况下,该算法较传统PSOLA算法能够获得更接近自然音质的语音。 蒋丹宁 蔡莲红 陶建华关键词:语音信号处理 正弦模型 朝鲜语文语转换及其拼接代价的研究 被引量:1 2006年 拼接代价函数是决定合成音自然度的重要因素之一。针对拼接代价函数,以往的研究只考虑拼接点处的特征向量是否相等,而没涉及到特征向量的一阶连续性。该文研究并实现了以三音子做为基元的朝鲜语文语转换系统,并研究了基元动态特征对拼接的影响,设计了能反映特征连续性的一种新的拼接代价函数,利用两个基元在拼接点处的特征向量及其一阶差分值计算拼接代价。实验结果表明,基于动态特征连续性的拼接代价函数可以较好地改善拼接处的频谱连续性,有效地提高了朝鲜语合成语音的自然度。 李光虎 蔡莲红关键词:语音合成