内蒙古自治区自然科学基金(2012MS0909)
- 作品数:3 被引量:12H指数:2
- 相关作者:王晶杨立东谢湘匡镜明尹栋更多>>
- 相关机构:北京理工大学内蒙古科技大学更多>>
- 发文基金:内蒙古自治区自然科学基金国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:电子电信更多>>
- 基于张量分解模型的语音信号特征提取方法被引量:7
- 2013年
- 提出了一种通过张量分解提取语音信号特征的方法.该方法对语音信号进行预处理,然后对每帧语音信号进行小波分解得到不同尺度上的信息,对这些信息提取传统特征参数,构建一个帧结构×分解尺度×特征参数的三阶张量,并经过张量分解得到各阶投影矩阵,从而建立语音信号在高阶空间上的特征体系,以便充分表征语音信号的特征.实验结果表明,本文提出的方法与传统特征参数体系比较,有利于语音识别系统性能的提高,并且对于带噪语音的识别具有一定的鲁棒性.
- 杨立东王晶谢湘匡镜明
- 关键词:张量分解特征提取投影矩阵
- 语音增强算法综述及性能分析被引量:2
- 2015年
- 语音增强是解决噪声污染的一种有效手段,其主要目标就是从带噪语音中尽可能地提取纯净语音,目前已发展为语音信号处理的一个重要分支,在实际中具有重要价值。实际中经常用到的算法主要有谱减法、维纳滤波、基于统计模型的增强算法(如MMSE)和子空间法。主要介绍谱减法、MMSE、两步消噪(TSNR)和子空间法的算法基本原理,并采用客观评价指标对四种典型算法的降噪效果进行比较和分析。
- 尹栋蒋涉权刘宝光杨立东王晶
- 关键词:语音增强谱减法MMSE子空间
- 基于Tucker分解的音频分类研究被引量:3
- 2015年
- 提出一种利用Tucker分解获得鲁棒性较强的音频信号不同属性的特征,在高斯混合模型上测试音频信号分类性能的方法。音频信号经过预处理后,提取其不同类型特征集合,包括常规声学特征参数集合、听觉感知特征参数集合、心理声学特征参数集合;然后由三种特征集合构建三阶特征张量,通过Tucker分解得到每一类特征阶投影矩阵并进行主分量分析;最后使用包括音乐、语音、噪声3种类型的300条音频数据测试不同特征集合的分类效果,在此过程中使用了有监督学习的高斯混合模型作为分类器。实验中比较了不同特征集合使用高斯混合模型的分类正确率。实验结果表明,Tucker分解获得的特征集合实现了较好的分类,说明该方法性能优于传统特征集合。
- 杨立东王晶谢湘匡镜明
- 关键词:音频分类高斯混合模型