李晋徽
- 作品数:9 被引量:35H指数:4
- 供职机构:解放军电子工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术电气工程更多>>
- 一种适用于说话人识别的改进Mel滤波器被引量:9
- 2013年
- Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。
- 项要杰杨俊安李晋徽陆俊
- 关键词:说话人识别MEL倒谱系数语音信号
- 关联小波神经网络与高斯混合模型说话人识别被引量:1
- 2013年
- 针对GMM模型在进行说话人识别时对噪声敏感以及在分类方面存在的缺陷,提出了一种小波神经网络和GMM结合的说话人识别模型,把GMM输出的似然概率和小波神经网络的训练相关联,采用带动量的BP算法和EM算法对小波神经网络和GMM模型分别训练,使目标说话人模型似然概率达到最大,进而提高说话人识别的效果。实验结果表明,新模型兼具小波神经网络抗噪声性能、学习分类能力以及GMM对说话人特征的描述能力,在多种噪声背景下能有效的提高说话人识别效果。
- 项要杰杨俊安李晋徽杨瑞国
- 关键词:信号处理语音识别说话人识别小波神经网络高斯混合模型
- 深度学习理论及其在语音识别领域的应用被引量:9
- 2014年
- 深度学习是模式识别和机器学习领域最新的研究成果,它以强大的建模和表征能力在图像和语音处理等领域取得了很好的应用。将深度学习引入到电子对抗领域的语音识别中,首先简单介绍了深度学习的基本理论,随后阐述了目前语音识别领域中语种识别、说话人识别和关键词检出存在的问题,并利用深度学习方法对这些突出的问题加以解决。
- 杨俊安王一刘辉李晋徽陆俊
- 关键词:语音识别特征提取声学建模
- 连续语音识别中基于Dropout修正线性深度置信网络的声学模型被引量:4
- 2016年
- 大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函数更接近生物神经网络的工作方式,增强了模型的表征能力;同时引入Dropout策略对修正线性深度置信网络进行调整,避免节点之间的协同作用,防止网络出现过拟合。文章利用公开语音数据集进行了实验,实验结果证明了所提出的声学模型构建方法相对于传统方法的优越性。
- 陈雷杨俊安王龙李晋徽
- 关键词:连续语音识别过拟合DROPOUT
- 一种新的基于瓶颈深度信念网络的特征提取方法及其在语种识别中的应用被引量:10
- 2014年
- 在语种识别中,传统的MFCC特征由于每帧信号上的信息量不足,很容易受到噪声污染,且抗噪能力较弱。同时,目前普遍使用的SDC特征提取方法在参数选择上需要人为设定,这增加了识别结果的不确定性。针对上述不足,将深度学习方法引入特征提取之中,提出了基于瓶颈深度信念网络的特征提取方法。最后在NIST2007数据库上对瓶颈层的大小、隐层数目以及瓶颈层位置进行了相关的对比实验,结果表明,提出的方法相对于传统的特征提取方法能够取得更高的识别率。
- 李晋徽杨俊安王一
- 关键词:语种识别
- 改进批处理RPEM算法用于说话人识别
- 2013年
- 针对传统EM算法训练GMM不能充分利用训练数据所属高斯分量信息,从而在一定程度上影响说话人识别性能的缺陷,采用RPEM(竞争惩罚EM)算法训练GMM,并引入批处理RPEM算法解决RPEM算法运算量大、收敛速度慢的问题,同时针对RPEM和批处理RPEM算法训练时方差优化存在的问题进行了改进,提出了改进的批处理RPEM算法。在Chains说话人识别数据库上的实验表明,改进的批处理RPEM算法取得了相对于传统EM、RPEM以及批处理RPEM算法更好的性能,还极大地提高了训练效率,减小了运算量,说明了提出的改进批处理RPEM算法用于说话人识别时的有效性。
- 项要杰杨俊安李晋徽杨瑞国
- 关键词:说话人识别期望最大化算法
- 基于核Fisher判别的分类器算法及其在语种识别中的应用研究
- 2013年
- GMM与SVM的建模和识别性能具有较好的互补性,因此GMM-SVM在语种识别中得到广泛使用,以其为基础的GMM-MMI-SVM已成为语种识别的主流研究方法。但是SVM在判别时仅仅使用了训练样本中的一些特殊样本即支持向量,并没有使用全部样本,从而影响了系统识别性能的进一步提高。针对上述问题,提出一种基于核Fisher判别的分类算法——GMM-MMI-KFD。该算法的核心思想是用核Fisher准则(KFD)替代SVM分类准则,从语音片段中提取出特征向量序列,分别通过GMM-MMI分类器与GMM-KFD分类器进行判决打分。相对SVM,KFD更注重语音数据非线性分布的特点,并且将样本向高维空间H上投影后可以最大限度地增大类间距,减小类内距。实验数据表明,GMM-MMI-KFD方法在语种识别中具有更高的识别率。
- 李晋徽杨俊安项要杰
- 关键词:语种识别核FISHER判别分类器融合
- 一种新的基于DBN的声学特征提取方法
- 2015年
- 大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升深度置信网络的识别准确率,提出一种基于区分性和ODLR自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高模型的鲁棒性。利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别结果取得了22.2%的提升。实验结果表明所提出的特征提取方法有效性。
- 陈雷杨俊安王龙李晋徽
- 关键词:连续语音识别
- 基于高斯滤波器及费舍尔准则的特征提取方法被引量:2
- 2013年
- 针对梅尔倒谱系数与翻转梅尔倒谱系数在语种识别应用中的不足,采用高斯滤波器代替三角滤波器,提出一种新的梅尔倒谱系数提取方法,解决传统梅尔倒谱系数提取中邻近滤波器相关性较弱的问题,并结合Fisher准则构造出最优混合特征参数,采用高斯混合模型分别对不同混合特征进行语种识别。实验结果表明:基于高斯滤波器及Fisher准则的改进梅尔倒谱系数混合特征参数作为语种识别特征具有较高的识别准确率。
- 李晋徽杨俊安项要杰
- 关键词:语种识别高斯滤波器FISHER准则GMM