您的位置: 专家智库 > >

郭武

作品数:91 被引量:214H指数:9
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金更多>>
相关领域:电子电信自动化与计算机技术语言文字更多>>

文献类型

  • 58篇期刊文章
  • 16篇专利
  • 14篇会议论文
  • 2篇学位论文
  • 1篇科技成果

领域

  • 52篇电子电信
  • 32篇自动化与计算...
  • 2篇语言文字

主题

  • 29篇语音
  • 20篇语音识别
  • 20篇说话人确认
  • 18篇向量
  • 16篇说话人识别
  • 14篇支持向量
  • 13篇支持向量机
  • 13篇向量机
  • 11篇神经网
  • 11篇神经网络
  • 6篇网络
  • 6篇高斯
  • 5篇端到端
  • 5篇识别方法
  • 5篇聚类
  • 5篇混合高斯
  • 5篇混合高斯模型
  • 5篇高斯模型
  • 4篇语音识别方法
  • 4篇噪声

机构

  • 91篇中国科学技术...
  • 1篇合肥学院
  • 1篇安徽大学
  • 1篇解放军信息工...
  • 1篇安徽省公安厅
  • 1篇国家互联网应...
  • 1篇科大讯飞股份...

作者

  • 91篇郭武
  • 33篇戴礼荣
  • 19篇王仁华
  • 7篇龙艳花
  • 6篇孙健
  • 5篇刘权
  • 5篇李轶杰
  • 3篇陈联武
  • 2篇姚红
  • 2篇陈志刚
  • 2篇章钊
  • 2篇刘庆锋
  • 2篇徐志海
  • 2篇徐守时
  • 2篇胡郁
  • 2篇张圣
  • 1篇胡国平
  • 1篇谭敏
  • 1篇滕永盛
  • 1篇王尔玉

传媒

  • 12篇模式识别与人...
  • 11篇数据采集与处...
  • 10篇小型微型计算...
  • 5篇清华大学学报...
  • 3篇自动化学报
  • 3篇中文信息学报
  • 3篇第九届全国人...
  • 2篇微计算机应用
  • 2篇微型机与应用
  • 2篇信号处理
  • 1篇中国图象图形...
  • 1篇电子与信息学...
  • 1篇通信学报
  • 1篇电子学报
  • 1篇西安交通大学...
  • 1篇计算机工程与...
  • 1篇计算机仿真
  • 1篇电脑知识与技...
  • 1篇第十届全国人...
  • 1篇第十三届全国...

年份

  • 1篇2024
  • 2篇2023
  • 8篇2022
  • 3篇2021
  • 5篇2020
  • 3篇2019
  • 3篇2018
  • 5篇2017
  • 6篇2016
  • 3篇2015
  • 1篇2014
  • 5篇2013
  • 1篇2012
  • 7篇2011
  • 2篇2010
  • 12篇2009
  • 7篇2008
  • 7篇2007
  • 1篇2006
  • 1篇2003
91 条 记 录,以下是 1-10
排序方式:
基于句子级BLEU指标挑选数据的半监督神经机器翻译被引量:5
2017年
在单语语料的使用上,统计机器翻译可通过利用语言模型提高性能,而神经机器翻译很难通过这种方法有效利用单语语料.针对此问题,文中提出基于句子级双语评估替补(BLEU)指标挑选数据的半监督神经网络翻译模型.分别利用统计机器翻译和神经机器翻译模型对无标注数据生成候选翻译,然后通过句子级BLEU指标挑选单语候选翻译,加入到有标注的数据集中进行半监督联合训练.实验表明,文中方法能高效利用无标注的单语语料,在NIST汉英翻译任务上,相比仅使用精标的有标注数据单系统,文中方法 BLEU值有所提升.
叶绍林郭武
采用无监督聚类得分规整的说话人确认方法
本发明公开了一种采用无监督聚类得分规整的说话人确认方法,包括:对于注册集当前说话人模型,与包含L条语料的规整数据集进行测试,得到L个测试得分;利用K均值算法对L个测试得分进行聚类,筛选出均值靠前的若干类得分;采用期望最大...
郭武古斌
文献传递
采用高级特征融合的端到端多通道语音识别方法
本发明公开了一种采用高级特征融合的端到端多通道语音识别方法,包括:对于多通道语音输入,采用与通道数目相同的编码器单独对一个通道的语音输入进行编码;所述编码器为多层金字塔结构的神经网络,神经网络最后一层输出的声学特征序列称...
郭武刘谭
基于语言学知识的发音质量评价算法改进被引量:15
2007年
随着普通话推广工作的深入,采用计算机进行普通话的辅助测试和学习的需求日益迫切。本文针对普通话发音特点,提出了一种改进的基于音素的自动发音质量评价算法。新算法在隐马尔科夫模型的对数后验概率算法基础上,引入普通话发音的语言学知识。与改进前相比,新算法不仅降低了运算量,而且在普通话水平测试的303人现场录音库上,使得机器打分与国家级评测员打分之间的相关度从0.704提升到0.795。
刘庆升魏思胡郁郭武王仁华
关键词:计算机应用中文信息处理语音识别语言学知识
采用模型间距离夹角的说话人确认测试算法
2008年
提出在与文本无关说话人确认中采用模型间马氏(Mahalanobis)距离的夹角作为测试算法,在混合高斯模型(Gaussian Mixture Model)的情况下,采用这种算法在保持识别率与传统的对数似然度算法相近的前提下,可以大大降低运算量,对于说话人确认或识别的实时实现有很大的帮助.另外,推荐的算法与传统的对数似然度算法的结果可以融合,可以将说话人确认的等错误率降低12~15%.
郭武王仁华戴礼荣
关键词:说话人确认
采用双向时序卷积与自注意力机制网络的语音识别系统
本发明公开了一种采用双向时序卷积与自注意力机制网络的语音识别系统,一方面,采用双向时序卷积与自注意力机制网络既保证语音时序的感知又提升:通过双向时序卷积(Bidirectional Temporal Convolutio...
郭武孙健
文献传递
基于自注意力机制的音频对抗样本生成方法
2024年
随着个人语音数据在网络上的传播以及自动说话人识别算法的发展,个人的声纹特征面对着泄露的风险。音频对抗样本可以在人耳主观听觉不变的前提下,使得自动说话人识别算法失效,从而保护个人的声纹特征。本文在典型的音频对抗样本生成算法FoolHD模型的基础上引入了自注意力机制来改进对抗样本生成,该方法称为FoolHD-MHSA。首先,使用卷积神经网络作为编码器来提取输入音频频谱的对抗扰动谱图;然后利用自注意力机制从全局角度提取扰动谱不同部分特征的关联特征,同时将网络聚焦到扰动谱中的关键信息、抑制无用信息;最后,使用解码器将处理后的扰动谱隐写到输入频谱中得到对抗样本频谱。实验结果表明,FoolHD-MHSA方法生成的对抗样本相比FoolHD方法有着更高的攻击成功率和平均客观语音质量评估(Perceptual evaluation of speech quality,PESQ)得分。
李珠海郭武
关键词:说话人识别
语音文档分类方法、系统、设备及存储介质
本发明公开了一种语音文档分类方法、系统、设备及存储介质,通过融合声学特征和深度特征实现语音文档分类,采用训练好的用于语音识别的声学模型为每个语音文档提取包含语义信息的深度特征,然后将语音文档的底层的声学特征和提取的深度特...
郭武刘谭
文献传递
基于模型距离和支持向量机的说话人确认被引量:2
2009年
针对采用支持向量机的说话人的确认问题,提出采用背景模型、说话人模型、测试语句模型间距离和夹角作为支持向量机的特征矢量,同时将组特征矢量与广义线性判别式序列核函数的参数相拼接,能够取得相对于基线的混合高斯模型算法更高的识别率。在2004年NIST评测数据库上,采用推荐算法的系统等错误率比基线的混合高斯-背景模型系统低16%。对说话人识别取得一定进展。
姚红梁栋郭武
基于均值超矢量聚类和特征映射的说话人确认被引量:1
2009年
在与文本无关的说话人确认研究中,特征映射是减少信道影响的最有效的方法之一。但是随着信道的复杂化,特征映射的效果很难体现出来。本文在混合高斯模型的均值超矢量上采用EM算法对信道类型进行聚类,然后通过特征映射的方法在特征参数域中减去信道的影响。在NIST SRE 2006数据库1conv4w-1conv4w任务上,采用本文方法的系统相对基线系统在等错误率上降低了18%。
郭武戴礼荣王仁华
关键词:说话人确认特征映射
共10页<12345678910>
聚类工具0