尹聪 作品数:5 被引量:2 H指数:1 供职机构: 太原理工大学信息工程学院 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 电子电信 经济管理 更多>>
基于感知对数面积比系数的说话人确认系统的研究 说话人识别,属于生物识别的一种,也被称为“声纹识别”,是根据说话人所发语音对说话人身份进行判定,实现对说话人身份的鉴别与认证的技术。由于语音具有通用性、独特性、高可采用性,及易收集性等特点,使得说话人识别技术得到广泛的应... 尹聪关键词:说话人识别 特征提取 辨证认识说话人自动识别系统 近年来,随着我国涉及说话人识别案件的逐年增多,特别是随着国外一些说话人自动识别系统的引进,应用领域中出现了一些崇外、盲目追求快速、省事的苗头。本文结合说话人自动识别系统的研究、应用状况,通过比对分析说话人自动识别与语音识... 杨俊杰 尹聪关键词:语音识别 法庭科学 特征参数 文献传递 辨证认识说话人自动识别系统 近年来,随着我国涉及说话人识别案件的逐年增多,特别是随着国外一些说话人自动识别系统的引进,应用领域中出现了一些崇外、盲目追求快速、省事的苗头。本文结合说话人自动识别系统的研究、应用状况,通过比对分析说话人自动识别与语音识... 杨俊杰 尹聪关键词:语音识别 法庭科学 特征参数 基于多窗频谱估计的PLAR特征提取 2014年 为提高PLAR特征在噪音环境下的鲁棒性,提出一种改进的感知对数面积比系数(Perceptual Log Area Ratio,PLAR)特征提取方法.在语音的前端处理中,引入多窗频谱估计方法(Multitapering),代替基线系统中传统的傅里叶(Discrete Fourier Transform,DFT)对信号进行频谱分析,从而获得新的特征参数MTPLAR.多窗频谱估计原理是采用多个窗函数的加权平均值来获得信号的频谱结构,具有更加稳定的频谱分析性能,因此可以获得抗噪性能更高的特征参数.实验结果表明:与传统提取方法获得的PLAR相比,基于改进方法的新特征的说话人确认系统在噪音环境下,平均等错误率获得了17%的相对提高,新特征提高了说话人确认系统的噪音鲁棒性. 尹聪 白静关键词:说话人识别 频谱估计 基于PLAR的说话人确认系统的噪音鲁棒性 被引量:2 2013年 针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。 尹聪 白静 龚宬 张陈昊 郑方 Waleed H.Abdulla关键词:说话人确认 鲁棒性