您的位置: 专家智库 > >

中国科学院战略性先导科技专项(XDA06030500)

作品数:12 被引量:36H指数:4
相关作者:颜永红孙鹏曾学文姜艳许春冬更多>>
相关机构:中国科学院北京理工大学国家互联网应急中心更多>>
发文基金:中国科学院战略性先导科技专项国家高技术研究发展计划国家自然科学基金更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 14篇会议论文
  • 12篇期刊文章

领域

  • 21篇电子电信
  • 4篇自动化与计算...
  • 1篇医药卫生

主题

  • 14篇语音
  • 9篇语音识别
  • 4篇神经网
  • 4篇神经网络
  • 4篇嵌入式
  • 4篇DNN
  • 3篇语音增强
  • 2篇信号
  • 2篇序贯
  • 2篇语音识别算法
  • 2篇语种
  • 2篇语种识别
  • 2篇置信度
  • 2篇随机场
  • 2篇条件随机场
  • 2篇奇异值
  • 2篇奇异值分解
  • 2篇小资
  • 2篇内存
  • 2篇矩阵

机构

  • 26篇中国科学院
  • 6篇国家互联网应...
  • 4篇北京理工大学
  • 4篇中国科学院大...
  • 3篇江西理工大学
  • 2篇中国科学院研...
  • 2篇中国科学院新...
  • 1篇河北师范大学
  • 1篇上海海洋大学
  • 1篇江苏联合职业...
  • 1篇国家计算机网...
  • 1篇亚利桑那州立...

作者

  • 11篇颜永红
  • 4篇计哲
  • 4篇姜艳
  • 4篇张鹏远
  • 4篇曾学文
  • 4篇孙鹏
  • 3篇付强
  • 3篇李军锋
  • 3篇许春冬
  • 2篇吴超
  • 2篇葛凤培
  • 2篇夏日升
  • 2篇朱小勇
  • 2篇国雁萌
  • 2篇潘接林
  • 2篇应冬文
  • 2篇张震
  • 2篇李煦
  • 1篇姜开宇
  • 1篇张晴晴

传媒

  • 5篇第十三届全国...
  • 3篇清华大学学报...
  • 2篇声学学报
  • 2篇计算机应用研...
  • 1篇计算机应用
  • 1篇天津大学学报...
  • 1篇计算机工程与...
  • 1篇西安电子科技...
  • 1篇网络新媒体技...
  • 1篇2016年全...
  • 1篇中国声学学会...

年份

  • 5篇2017
  • 2篇2016
  • 6篇2015
  • 3篇2014
  • 9篇2013
  • 1篇2012
12 条 记 录,以下是 1-10
排序方式:
基于DNN的声学模型自适应实验被引量:5
2015年
声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能.
张宇计哲万辛张震葛凤培颜永红
关键词:语音识别
两扬声器配置下的串声消除系统参数优化设置被引量:1
2014年
针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。
许春冬李军锋裘嫄夏日升颜永红
关键词:三维声音逆滤波
基于空间声场扩散信息的混响抑制方法
在远讲语音应用中,房间混响严重影响了语音的质量和主观听觉感受。在信号源与系统均未知的前提下,当前的混响抑制方法普遍存在混响不能准确建模的问题。本文利用双通道混响语音信号,根据语音直达声和混响声所反映出的声场扩散信息,提出...
王晓飞姜开宇国雁萌付强颜永红
关键词:语音增强功率谱
基于PLDA的“一对多”下的说话人确认方法研究
近年来,概率线性鉴别分析(Probabilistic Linear Discriminant Analysis,PLDA)因其优异的性能而得到学者们的广泛关注。然而,各主流单位的PLDA研究都是基于NISTSRE 201...
许云飞黄厚军金怡珠李桂莲周若华
关键词:说话人识别
基于SVM的合成语音检测
斯超向量分类技术引入到了合成语音检测系统中,利用svm二分类起进行合成语音检测在保证检测速度的情况下可以达到一个较为优秀的效果。但由于训练数据标注问题,对性能还是一定影响。并且在更大的训练数据规模下,svm也很难进一步进...
杨朔计哲郭耀辉颜永红
关键词:自动化检测信号识别
一种嵌入式终端多应用网络资源分配协议被引量:1
2013年
为了在嵌入式终端多应用之间合理分配有限的网络带宽资源,提出一种嵌入式终端多应用网络资源分配协议。根据应用特性对网络数据包进行分类,结合实时探测的可用带宽,为每种类型数据包分别添加不同的延迟时间,依据延迟大小调度数据包。将该协议应用于实际IP机顶盒中,在同时运行HTTP流媒体应用和FTP下载应用的环境中,能够优先保证前台流媒体应用的流畅播放。实验结果表明,该协议在多应用运行环境下,能够优先满足用户关注度高的应用网络带宽需求,实现了网络资源在嵌入式终端上的合理分配。
姜艳曾学文孙鹏朱小勇
关键词:嵌入式终端网络资源分配
多领域系统融合在语音云系统中的应用
<正>0引言近年来,各大IT公司推出了自己的语音云系统,语音识别技术被大量运用到人们的日常生活中。通过云系统的强大计算能力,用户可利用语音通过移动终端打开手机应用,编辑短信、电子邮件,拨打电话和搜索网页等。各式各样的功能...
陈梦喆张晴晴颜永红
文献传递
利用二重打分方法的激活词语音识别
<正>0引言语音被认为是人与人之间交流最自然的方式之一,自动语音识别(ASR)也是一种重要的人机交互方式。几十年来,众多学者做了大量与语音识别相关的工作,其中的一个方向就是激活词语音识别,也可以称为激活词检测:向机器发出...
邢安昊黎塔颜永红
文献传递
汉语连续语音识别系统中三音子模型的优化被引量:4
2013年
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
齐耀辉潘复平葛凤培颜永红
关键词:三音子模型最大后验概率
基于SVM一对一分类的语种识别方法
语种识别系统通常采用支持向量机(SVM)一对多加高斯后端分类器的方法进行分类。传统的SVM一对一分类在进行线性鉴别性分析(LDA)时特征值矩阵往往为奇异的,识别性能很低。本文提出一种改进的一对一分类方法,对SVM一对一得...
王宪亮吴志刚杨金超周若华颜永红
关键词:支持向量机语种识别
共3页<123>
聚类工具0