郑榕
- 作品数:9 被引量:19H指数:2
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 一种面向海量广播电视监管的自动新闻拆条方法
- 本发明公开了一种面向海量广播电视监管的自动新闻拆条方法,包括以下步骤:初始化广播电视数据自动获得新闻节目音频波形和视频图像;提取新闻数据的音视频特征,包括主持人检测、字幕检测与跟踪和语音检测;通过启发式规则获取新闻条目边...
- 冯柏岚郑榕陈智能徐波
- 文献传递
- 基于GMM-UBM的稳健说话人识别系统
- 本文介绍了一种基于MFCC倒谱特征和GMM-UBM模型的稳健说话人识别系统,旨在基于当前主流技术的基础上进一步改进系统识别率和噪声鲁棒性,因此本文仅对低层次的声学特征进行提取和建模,并对系统的前端处理进行了如下改进:提出...
- 浦剑涛郑榕姜洪臣徐波
- 关键词:语音识别语音处理说话人识别系统
- 文献传递
- 一种面向海量广播电视监管的自动新闻拆条方法
- 本发明公开了一种面向海量广播电视监管的自动新闻拆条方法,包括以下步骤:初始化广播电视数据自动获得新闻节目音频波形和视频图像;提取新闻数据的音视频特征,包括主持人检测、字幕检测与跟踪和语音检测;通过启发式规则获取新闻条目边...
- 冯柏岚郑榕陈智能徐波
- 文献传递
- 基于GMM-UBM的稳健说话人识别系统
- 本文介绍了一种基于MFCC倒谱特征和GMM-UBM模型的稳健说话人识别系统,旨在基于当前主流技术的基础上进一步改进系统识别率和噪声鲁棒性,因此本文仅对低层次的声学特征进行提取和建模,并对系统的前端处理进行了如下改进:提出...
- 浦剑涛郑榕姜洪臣徐波
- 关键词:说话人识别MFCCCMNSDC
- 文献传递
- 基于SDC特征和GMM-UBM模型的自动语种识别被引量:14
- 2007年
- 本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以快速得到每个语种的模型。与传统的GMM方法相比,该方法的训练和识别的速度更快。该方法对OGI电话语音库中11个语种进行了测试,其10秒、30秒和45秒句子的最佳识别正确率分别为72.38%、82.62%和85.23%,识别速度约为0.03倍实时。
- 姜洪臣郑榕张树武徐波
- 关键词:计算机应用中文信息处理
- 基于特征规整和评分规整的说话人确认研究被引量:4
- 2006年
- 在说话人确认系统中,训练和测试的声学环境不匹配将造成性能急剧下降。本文提出了从特征规整和评分规整两个方面进行补偿的方法。首先,改进了基于分段的倒谱均值方差规整(SCMVN)方法,将倒谱系数都规整到相同的段内高斯统计分布,以提高不同环境条件下特征匹配程度;其次,针对由于不同说话人和不同测试环境引起的输出评分分布变化,提出了两阶段的评分规整方法,即先零规整再测试规整(TZnorm)和先测试规整再零规整(ZTnorm)两种得分变换方法,使得失配条件下与说话人无关的决策门限更加鲁棒。基于NIST2002说话人识别评测库上的实验表明,采用SCMVN的特征规整和ZTnorm的评分规整方法能够明显地提高系统性能。与采用倒谱均值减和零规整的基线系统相比,等错误率和最小检测代价分别降低了20.3%和18.1%。
- 郑榕张树武徐波
- 关键词:计算机应用中文信息处理说话人确认
- 电话语音环境的鲁棒说话人识别
- 电话语音环境下说话人识别技术的研究面临许多亟待解决的问题,包括语音环境的通道鲁棒性、说话人差异和系统判决拒识等等。近年来,针对概率统计模型和区分训练框架,研究人员进行了很多有益地探索和研究,这对于说话人识别技术走向实用有...
- 郑榕
- 关键词:语音识别支持向量机
- 一种快速说话人搜索算法被引量:1
- 2008年
- 随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略地筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著地提高说话人识别的速度。
- 朱磊江杰郑榕徐波
- 关键词:计算机应用中文信息处理说话人识别
- 基于词图的音素识别及在语种识别中的应用
- 2008年
- 本文介绍了一种基于词图的并行音素识别方法的自动语种识别系统,基于词图的并行音素识别方法是并行音素识别方法的一个扩展,它用识别产生的词图来描述声学候选结果空间,比并行音素识别方法中用最佳路径音子序列包含更丰富的信息。通过真实环境广播语音测试表明,该方法比并行音素识别方法识别性能提升了约6%,在每个语种约4小时的训练数据下,跟其他的几种语种识别方法也有可比的性能。
- 王士进郑榕徐波
- 关键词:计算机应用中文信息处理语种识别