公共文化服务平台

夏丙寅: 作品数：11 被引量：51H指数：4; 供职机构：北京工业大学电子信息与控制工程学院更多>>; 发文基金：北京市教育委员会科技发展计划国家自然科学基金北京市属高等学校人才强教计划资助项目更多>>; 相关领域：电子电信自动化与计算机技术更多>>

合作作者

一种基于自适应噪声估计的宽带语音增强算法被引量：1: 2011年; 为解决传统算法对噪声适应性较差,残留音乐噪声较强的问题,本文提出了一种基于自适应噪声估计的宽带语音增强算法。该算法可应用于宽带语音编码器,以提升在噪声环境下的编码质量。本文所提算法利用谱熵对噪声类型进行有效地判别,将背景噪声分为白噪声和有色噪声两类,并根据噪声特性选择适当的噪声估计方法。在白噪声背景下,选择一种谱平滑的方法;在有色噪声背景下,则选择经典的最小值控制递归平均算法。在此基础上结合经典的统计模型方法,构建一种具有较强噪声鲁棒性的宽带语音增强算法。在ITU-T G.160标准下对算法进行性能测试,测试结果表明,在不同强度的背景噪声环境下,增强语音的信噪比提高都较为明显。同时,在低信噪比情况下,该算法有效地抑制了严重影响听觉质量的音乐噪声现象。; 周璇鲍长春夏丙寅梁岩何玉文; 关键词：噪声估计统计模型谱熵

一种基于自适应噪声估计的宽带语音增强算法: 为解决传统算法对噪声适应性较差，残留音乐噪声较强的问题，本文提出了一种基于自适应噪声估计的宽带语音增强算法。该算法可应用于宽带语音编码器，以提升在噪声环境下的编码质量。本文所提算法利用谱熵对噪声类型进行有效地判别，将背景...; 周璇鲍长春夏丙寅梁岩何玉文; 关键词：噪声估计统计模型谱熵

双麦克风噪声消除的高斯混合模型法被引量：1: 2014年; 为了解决基于相位差滤波器(PBF)双麦克风方法残留噪声较多的问题,本文在PBF方法基础上提出一种基于高斯混合模型的双麦克风噪声消除方法。该方法首先采用高斯混合模型(GMM)对目标语音存在(l1)与目标语音不存(l0)在这两种情况进行建模。其次,在实时增强阶段,根据贝叶斯分类器计算每帧的目标语音存在概率(TSPP),随后根据噪声抑制最大化准则修正PBF的增益函数并得到改进的相位差滤波器(IPBF),最后将TSPP与IPBF的增益函数相结合,进而得到一种用于双麦克风噪声消除的掩蔽滤波器。实验结果表明:本文提出算法可有效抑制残留噪声,尤其是在目标语音不存在的时间段。; 陈浩鲍长春夏丙寅; 关键词：噪声消除相位差高斯混合模型

面向移动通信的单通道语音增强方法研究: 近年来，单通道语音增强技术在移动语音通信系统中获得了广泛的应用，但在复杂噪声场景中其性能往往不能达到实际应用的需求。　　本文从噪声估计方法的改进、现有语音增强技术的融合、人工神经网络在语音增强中的应用，以及应用于移动通信...; 夏丙寅; 关键词：压缩域小波融合移动通信

基于高斯混合模型的压缩域语音增强方法被引量：9: 2012年; 为了有效利用纯净语音导抗谱频率参数(ISFs)的先验知识,本文针对ITU-T G.722.2宽带语音编码标准提出了一种基于高斯混合模型的压缩域语音增强方法.首先,将含噪语音、纯净语音的导抗谱频率参数,以及对应的增益调整因子构成特征矢量,并利用高斯混合模型拟合其概率密度;然后,在最小均方误差(MMSE)准则下对纯净语音的特征参数进行最优贝叶斯估计.为了兼容编码器中的非连续性传输模式,当处理信号为非语音信息时,算法在保持噪声帧谱包络参数不变的前提下,按固定比例调整对数帧能量;且若出现帧擦除情况,算法不调整接收到的码流,并按正常帧处理方式调整恢复后的参数以更新相关历史.本文采用ITU-T G.160标准进行了性能测试,结果表明,与参考方法相比,所提方法在保证信噪比提高能力的同时,可以达到更大的噪声衰减量,且增强语音的客观质量更优.; 梁岩鲍长春夏丙寅何玉文周璇李娜; 关键词：语音增强参数域高斯混合模型贝叶斯估计

适应噪声强度突变的噪声估计加速方法: 为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均(MCRA)方法基础上提出了噪声估计加速方法.该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵...; 夏丙寅鲍长春; 关键词：语音增强噪声估计对数似然比; 文献传递

适应噪声强度突变的噪声估计加速方法被引量：3: 2013年; 为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均(MCRA)方法基础上提出了噪声估计加速方法。该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵和平均幅度差函数进行话音活动性检测(VAD),而后结合噪声估计与功率谱最小值比例等辅助参数判定是否对噪声估计进行强制更新。ITU-T G.160测试结果表明,噪声估计加速算法的引入未对噪声强度平稳情况下的语音增强算法性能产生影响,但显著降低了噪声强度突变时的收敛时间,并在很大程度上抑制了噪声估计收敛段中的音乐噪声。; 夏丙寅鲍长春; 关键词：语音增强噪声估计谱熵对数似然比

复杂环境下基于时延估计的声源定位技术研究被引量：18: 2014年; 为了改善在复杂环境下声源定位算法的性能,提出了一种新的时延估计(TDE)方法,即基于传递函数比的统计模型方法(ATFR-SM)。该方法采用统计模型去除噪声对传递函数(ATF)的影响,在计算传递函数时对功率谱密度(PSD)进行平滑和"白化",以去除混响对传递函数的影响。同时,算法中引入话音激活检测(VAD)去除对求取传递函数无用的噪声段,以提高时延估计的准确性。此外,将所提时延估计方法与线性定位法相结合,构成一套完整的声源定位方法。实验结果表明,在复杂环境下,时延估计方法具有更低的异常点百分比(PAP)和均方根误差(RMSE),且明显优于传统的参考算法,同时声源定位方法具有更高的定位精度。; 张大威鲍长春夏丙寅; 关键词：时延估计 VAD 统计模型声源定位

基于辨别性深度信念网络的说话人分割被引量：10: 2013年; 该文基于语音信号的超矢量特征空间,提出了一种基于Fisher准则的可辨别性深度信念网络(discriminativedeep belief network,DDBN)训练方法,得到了优于传统深度信念网络(deep belief network,DBN)的说话人码本矢量特征,并利用这些码本特征对多说话人的音段进行了聚类与分割。由TIMIT数据库生成的多说话人语音分割的实验结果表明,该基于Fisher准则函数的DDBN说话人分割算法的性能明显好于传统的Bayes信息判决(Bayesian informa-tion criterion,BIC)法和DBN法。; 马勇鲍长春夏丙寅; 关键词：FISHER准则

基于AR-HMM在线能量调整的语音增强方法被引量：6: 2014年; 针对单通道语音增强技术对非平稳噪声的跟踪不准确、噪声抑制效果较差的问题,本文提出一种基于在线能量调整的语音增强方法.该方法以归一化临界带能量为特征,采用高斯混合模型对背景噪声进行分类,利用对应类型噪声的自回归隐马尔可夫模型(Auto-Regressive Hidden Markov Model,AR-HMM)和纯净语音的AR-HMM,在最小均方误差准则下估计语音和噪声的功率谱.考虑到非平稳环境中训练集和测试集的差异性,需在线调整语音模型和噪声模型中的能量,语音模型的能量调整采用迭代的期望最大化算法;噪声模型的能量调整则利用的是模型训练过程中的能量重估方法,并以最小值控制的递归平均算法确定噪声能量调整的初始值.在ITU-T G.160标准下对算法进行性能测试,测试结果表明,本文方法对非平稳噪声的跟踪效果较好,对噪声衰减量较大,收敛时间较短.; 何玉文鲍长春夏丙寅; 关键词：语音增强非平稳噪声隐马尔可夫模型高斯混合模型

夏丙寅

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

夏丙寅

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈