纪璇
- 作品数:2 被引量:0H指数:0
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信更多>>
- 一种结合G.719编解码器的参数立体声音频编解码扩展方法
- 2014年
- 针对ITU-T G.719全频带音频编码标准尚不支持立体声压缩编码的问题,结合G.719编解码器提出并设计基于离散傅里叶变换(discrete Fourier transform,DFT)的参数立体声音频编解码扩展模块.输入音频信号进行DFT变换后在子带内提取相应的空间参数,并将左右声道下混为和声道;解码时,对和声道进行能量补充,分别运用等式法和基于Givens旋转的奇异值分解法(singular value decomposition,SVD)进行解码恢复.测试结果表明,在G.719中合理设计参数立体声编解码可以获得较好的压缩效果,对于平缓的音乐,等式法比奇异值分解法可解码得到稍高的音质,且复杂度较低;对于变化较快的音乐,奇异值分解法可得到相对较好的音质,但复杂度较高.
- 王晶赵毅纪璇
- 面向语音识别的深度映射网络谱/特征增强方法
- 近年来,将深度神经网络(deep neural network,DNN)应用于语音增强取得了一定的效果。该文采用DNN,通过大量数据来学习带噪信号到干净信号之间的非线性映射关系,形成深度映射网络,以谱映射(spectra...
- 王子腾纪璇王晓飞付强颜永红
- 关键词:语音增强谱映射特征映射
- 文献传递