您的位置: 专家智库 > >

王晓飞

作品数:11 被引量:16H指数:2
供职机构:中国科学院声学研究所更多>>
发文基金:中国科学院战略性先导科技专项国家自然科学基金国家高技术研究发展计划更多>>
相关领域:电子电信自动化与计算机技术语言文字更多>>

文献类型

  • 5篇会议论文
  • 4篇期刊文章
  • 2篇专利

领域

  • 8篇电子电信
  • 1篇自动化与计算...
  • 1篇语言文字

主题

  • 11篇语音
  • 10篇语音增强
  • 7篇混响
  • 4篇信号
  • 4篇阵列
  • 4篇传声
  • 4篇传声器
  • 4篇传声器阵
  • 4篇传声器阵列
  • 3篇抑制方法
  • 3篇语音增强方法
  • 3篇声场
  • 3篇空间声场
  • 3篇功率谱
  • 2篇多通道
  • 2篇信号处理
  • 2篇语音信号
  • 2篇声学环境
  • 2篇前端
  • 2篇前端处理

机构

  • 11篇中国科学院
  • 2篇中国科学院大...
  • 1篇中国科学院新...

作者

  • 11篇付强
  • 11篇王晓飞
  • 10篇颜永红
  • 6篇国雁萌
  • 3篇姜开宇
  • 1篇吴超
  • 1篇葛凤培
  • 1篇潘接林
  • 1篇纳跃跃
  • 1篇纪璇
  • 1篇李煦
  • 1篇曹占中

传媒

  • 2篇声学学报
  • 1篇清华大学学报...
  • 1篇中国科学:信...
  • 1篇第十三届全国...

年份

  • 2篇2019
  • 2篇2017
  • 4篇2015
  • 3篇2013
11 条 记 录,以下是 1-10
排序方式:
采用性别相关的深度神经网络及非负矩阵分解模型用于单通道语音增强被引量:12
2019年
为了从带噪信号中得到纯净的语音信号,提出了一种采用性别相关模型的单通道语音增强算法。具体而言,在训练阶段,分别训练了与性别相关的深度神经网络-非负矩阵分解模型用于估计非负矩阵分解中的权重参数;在测试阶段,提出了一种基于非负矩阵分解和组稀疏惩罚的算法用于判断测试语音中说话人的性别信息,然后再采用对应的模型估计权重,并结合已训练好的字典进行语音增强。实验结果表明所提算法在噪声抑制量及语音质量上,均优于一些基于非负矩阵分解的算法和基于深度神经网络的算法。
李煦王子腾王晓飞王晓飞付强
关键词:语音增强NMF非负矩阵DNN幅度谱
一种基于语义先验的选择性注意的多通道语音增强方法
本发明提供了一种基于语义先验的选择性注意的多通道语音增强方法,所述方法包括:多传声器阵列拾取来自于混响环境中的任意方向的语音信号,采集多路语音信号并进行预处理;利用激活词语音识别模型检测预处理后的语音信号中存在的特定激活...
付强王晓飞国雁萌颜永红
文献传递
面向语音识别的深度映射网络谱/特征增强方法
近年来,将深度神经网络(deep neural network,DNN)应用于语音增强取得了一定的效果。该文采用DNN,通过大量数据来学习带噪信号到干净信号之间的非线性映射关系,形成深度映射网络,以谱映射(spectra...
王子腾纪璇王晓飞付强颜永红
关键词:语音增强谱映射特征映射
文献传递
基于空间声场扩散信息的混响抑制方法
在远讲语音应用中,房间混响严重影响了语音的质量和主观听觉感受。在信号源与系统均未知的前提下,当前的混响抑制方法普遍存在混响不能准确建模的问题。本文利用双通道混响语音信号,根据语音直达声和混响声所反映出的声场扩散信息,提出...
王晓飞姜开宇国雁萌付强颜永红
关键词:语音增强功率谱
文献传递
具有选择注意能力的语音拾取技术被引量:4
2015年
随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以及同时存在的其他声源等.如果不采用近讲的拾音方式,那么这些因素都会对传播中的语音声波造成干扰.特别是当多个语音系统和多个说话人处于同一环境时,如何确保系统正确接收语音信息,决定了语音系统能否走向实用.本文参考人类的听觉注意机理,提出充分利用对目标语音及干扰声源的先验知识,检测和提升目标语音,并通过将传声器阵列、语音唤醒、目标语音检测、语音增强、混响抑制等一系列技术相结合,实现抗干扰的目标语音拾取.
王晓飞国雁萌葛凤培吴超付强颜永红
关键词:传声器阵列语音增强
多源混响声学环境下的语音前端处理
前端信号处理是自然语音人机交互和人人语音通信系统中,重要而又极具挑战的环节。现实生活的声学环境都是多声源,有混响的。多源混响声学环境使得语音前端信号处理的鲁棒性受到制约,声学回波、环境噪声、房间混响以及非目标的任何干扰信...
付强王晓飞
关键词:信号处理语音增强人机交互
文献传递
一种基于语义先验的选择性注意的多通道语音增强方法
本发明提供了一种基于语义先验的选择性注意的多通道语音增强方法,所述方法包括:多传声器阵列拾取来自于混响环境中的任意方向的语音信号,采集多路语音信号并进行预处理;利用激活词语音识别模型检测预处理后的语音信号中存在的特定激活...
付强王晓飞国雁萌颜永红
文献传递
多源混响声学环境语音交互前端处理--方法和实践
本文从综述性角度,结合笔者在该领域的部分研究进展和实践经验,系统阐述现有语音前端信号处理方法和技术.语音交互前端信号处理是自然语音人机交互和人人语音通信系统中,重要而又极具挑战的环节.现实生活的声学环境都是多声源,有混响...
付强王晓飞颜永红
关键词:语音交互鲁棒性
文献传递
基于空间声场扩散信息的混响抑制方法
在远讲语音应用中,房间混响严重影响了语音的质量和主观听觉感受。在信号源与系统均未知的前提下,当前的混响抑制方法普遍存在混响不能准确建模的问题。本文利用双通道混响语音信号,根据语音直达声和混响声所反映出的声场扩散信息,提出...
王晓飞姜开宇国雁萌付强颜永红
关键词:语音增强功率谱
传声器阵列波束比判决语音增强方法
2017年
针对单一波束形成器难以深度抑制空间相干干扰的问题,提出了一种综合了最小方差无畸变响应波束形成器与对称子阵延时求和波束形成器的语音增强方法。定义了一种波束输出比因子,根据该因子在目标声区域和干扰声区域的幅值变化,给出了采样协方差矩阵对角加载量的调整方法,并进一步利用该因子在后滤波环节对空间干扰进行判决滤波。文中对判决滤波时的上限阈值和下限阈值的实时更新方法给出了说明。所提出的算法能进一步抑制空间干扰和噪声,且可满足实时需要。在传声器圆阵上的实验表明,该方法在输出信干噪比及语音质量上,均优于经典对角加载算法及采样协方差矩阵扫描重构算法。
曹占中纳跃跃王晓飞付强潘接林颜永红
关键词:波束形成器语音增强传声器阵列语音质量圆阵最小方差
共2页<12>
聚类工具0