李轶南
- 作品数:15 被引量:37H指数:4
- 供职机构:解放军理工大学更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法
- 本发明公开了一种基于可分离深度自动编码技术的无监督噪声估计和语音增强方法,包括事前处理和对被未知噪声污染的语音增强,可以灵活运用于各类语音处理场景:不局限于语音内容所属的语言、不受限于说话人的变化、不受限于噪声的种类等,...
- 孙蒙李轶南张雄伟王艺敏邹霞贾冲李莉
- 随机测量条件下的循环自相关函数无网格估计
- 2017年
- 利用循环平稳特性对通信信号进行参数估计是一种常用的处理方法。由于通信信号在循环频率域具有稀疏特性,可以利用随机测量有效降低采样处理的数据量,减轻硬件负荷,并基于压缩采样值进行信号参数估计。然而,在稀疏建模时通常将连续的信号参数空间划分为有限数量的均匀网格,引起基不匹配问题,使得信号在某个假定的离散变换基(傅里叶基、小波基等)下并不稀疏,从而严重影响信号参数估计精确度。为解决这个问题,本文利用原子范数描述循环频率域的连续性和稀疏性,提出一种随机测量条件下的高精确度循环自相关函数无网格估计方法。仿真实验表明,这种无网格估计方法能够有效降低循环自相关函数的估计误差。
- 陈栩杉张雄伟杨吉斌乔林李轶南王文
- 关键词:压缩感知循环自相关函数半定规划
- 字典学习和稀疏表示的无监督语音增强算法被引量:1
- 2014年
- 针对非结构噪声难以去除的问题,基于字典训练和稀疏表示提出一种无监督语音增强算法。该算法通过构造过完备字典并使用带噪语音样本对其进行训练来实现。首先指出K-奇异值分解算法(K-SVD)存在的不足并提出一种新的改进的字典训练算法:K-双边随机投影算法(K-BRP);然后使用K-BRP算法不断更新字典矩阵和相应的增益系数矩阵,从被非结构化噪声所污染的带噪语音中提取出结构性强的纯净语音。大量实验结果表明,由于训练样本考虑到了语音信号的时频域局部结构特征,所提算法能够很好地消除随机噪声,并且在低信噪比情况下仍然能够保持较高的语音质量和可懂度。
- 李轶南贾冲张立伟闵刚曾理
- 关键词:语音增强
- 改进的稀疏字典学习单通道语音增强算法被引量:12
- 2014年
- 基于K奇异值分解字典学习方法及其非负约束下的修改算法,本文提出一种改进的单通道语音增强算法。该算法将噪声划分为结构化噪声和非结构化噪声两部分。首先通过稀疏字典学习的方法对结构化噪声进行建模,训练出噪声字典;然后,使用所得噪声字典去除带噪语音中的结构化噪声;最后,采用过完备字典和稀疏表示的方法对纯净语音进行提取,去除非结构化噪声。实验结果表明,在平稳或非平稳噪声环境下,本文算法均能有效去除加性噪声,性能优于多带谱减法和基于非负稀疏编码的增强算法。
- 李轶南张雄伟曾理黄建军
- 关键词:语音增强字典学习
- 一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法
- 本发明公开了一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法,该方法对输入的时域信号经过加窗、分帧后,经傅里叶变换并取模得到该语句的幅度谱;估计得到稀疏的语音成分<Image file="DDA0000652176...
- 孙蒙张雄伟李轶南
- 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法
- 本发明公开了一种基于可分离深度自动编码技术的无监督噪声估计和语音增强方法,包括事前处理和对被未知噪声污染的语音增强,可以灵活运用于各类语音处理场景:不局限于语音内容所属的语言、不受限于说话人的变化、不受限于噪声的种类等,...
- 孙蒙李轶南张雄伟王艺敏邹霞贾冲李莉
- 文献传递
- 改进贝叶斯非负矩阵分解的语音增强算法被引量:2
- 2015年
- 为了进一步提高增强语音的质量,基于传统的贝叶斯非负矩阵分解语音增强算法,考虑语音帧内原子间的相关性,提出了一种新的改进贝叶斯非负矩阵分解语音增强算法。该算法可分为训练和增强2个阶段:训练阶段利用该算法分别对纯净语音和噪声进行训练,得到纯净语音和噪声字典;增强阶段利用训练得到的纯净语音和噪声字典组成的联合字典结合,计算带噪语音时变增益,并利用最小均方误差估计得到增强语音频谱,进而重构增强语音。实验结果表明,该算法的对数频谱距离值和主观语音质量评估打分均优于非负矩阵分解(NMF)和贝叶斯非负矩阵分解(BNMF)等传统的语音增强算法,特别是在低信噪比条件下,该算法增强的效果更佳。
- 张立伟张雄伟胡永刚闵刚李轶南
- 关键词:语音增强
- 非负组合模型及其在声源分离中的应用被引量:2
- 2017年
- 非负组合模型在人工智能、数据挖掘和智能信息处理研究领域具有十分重要的应用意义,已经逐渐成为声源分离中最常使用以及最具代表性的模型之一。内含于其中的非负成分的加性组合与人类听觉系统的感知机理高度契合。利用非负组合模型进行声源分离的技术正在变得越来越流行。本文从被称作非负矩阵分解的最基本的非负组合模型开始,首先回顾了非负组合模型的基本原则,包括需要求解的基本问题、目标函数的度量以及求解相关问题的常用方法。在此基础上,系统地讨论了非负矩阵分解在声源分离不同应用领域的拓展。最后指出并讨论非负组合模型研究中有待进一步研究的开放问题。
- 张雄伟李轶南时文华胡永刚陈栩杉
- 关键词:非负矩阵分解
- 稀疏低秩噪声模型下无监督实时单通道语音增强算法被引量:8
- 2015年
- 针对现有基于字典学习的增强算法需要先验信息、不易实时处理的问题,提出一种便于实时处理的无监督的单通道语音增强算法。首先,该算法将无监督条件下背景噪声的建模问题转化为带噪语音幅度谱的稀疏低秩噪声分解;然后,采用增量非负子空间方法对背景噪声进行在线字典学习,获得能够体现背景噪声时变特性的自适应噪声字典;最后,利用所得的噪声字典,采用易于实时处理的逐帧迭代方式,对带噪语音进行处理。实验结果表明:相较于多带谱减法和基于低秩稀疏矩阵分解的增强算法,所提算法在噪声抑制方面的性能尤为显著,在多项性能评价指标上,均表现出更好的结果。
- 李轶南张雄伟贾冲陈亮曾理
- 关键词:语音增强带噪语音噪声模型背景噪声矩阵分解幅度谱
- 稀疏低秩模型下的单通道自学习语音增强算法被引量:4
- 2014年
- 针对现有基于字典学习的增强算法依赖先验信息的问题,基于矩阵的稀疏低秩分解提出一种无监督的单通道语音增强算法。该算法首先通过稀疏低秩分解将带噪语音的幅度谱分解为低秩、稀疏和噪声3部分,然后通过对低秩部分进行自学习构建出噪声字典,最后利用所得噪声字典和乘性迭代准则于低秩和稀疏部分中分离出纯净语音。相较于其他基于字典学习的语音增强算法,本文所提算法无需语音或噪声的先验信息,因而更加方便和实用。实验结果显示,本文算法能够在保留语音谐波结构的同时有效抑制噪声,增强效果明显优于鲁棒主成分分析和多带谱减法。
- 李轶南贾冲杨吉斌吴海佳张立伟
- 关键词:语音增强无监督学习字典学习