您的位置: 专家智库 > >

韩疆

作品数:22 被引量:17H指数:3
供职机构:中国科学院声学研究所更多>>
发文基金:国家重点基础研究发展计划更多>>
相关领域:电子电信自动化与计算机技术语言文字更多>>

文献类型

  • 9篇会议论文
  • 6篇期刊文章
  • 6篇专利
  • 1篇学位论文

领域

  • 9篇电子电信
  • 6篇自动化与计算...
  • 2篇语言文字

主题

  • 16篇语音
  • 13篇语音识别
  • 5篇搜索
  • 4篇令牌
  • 3篇音素
  • 3篇置信度
  • 3篇搜索方法
  • 3篇系统设计
  • 3篇关键词
  • 3篇关键词检测
  • 2篇多时间尺度
  • 2篇多时间尺度特...
  • 2篇音频
  • 2篇语音识别系统
  • 2篇语音特征
  • 2篇声学
  • 2篇声学结构
  • 2篇声学模型
  • 2篇说话人识别
  • 2篇搜索空间

机构

  • 19篇中国科学院
  • 6篇北京中科信利...
  • 3篇北京航空航天...

作者

  • 22篇韩疆
  • 12篇颜永红
  • 6篇张鹏远
  • 6篇刘晓星
  • 6篇潘接林
  • 3篇张建平
  • 2篇国雁萌
  • 2篇尹宝林
  • 2篇邵建
  • 1篇刘赵杰
  • 1篇庹凌云

传媒

  • 2篇2005全国...
  • 1篇电子与信息学...
  • 1篇声学学报
  • 1篇微计算机应用
  • 1篇通信学报
  • 1篇科技开发动态
  • 1篇北京航空航天...
  • 1篇第七届全国人...
  • 1篇中国声学学会...

年份

  • 1篇2007
  • 1篇2006
  • 10篇2005
  • 3篇2004
  • 4篇2003
  • 2篇2000
  • 1篇1999
22 条 记 录,以下是 1-10
排序方式:
一种任务域无关的语音关键词检测系统被引量:4
2006年
提出了面向语音关键词检测的多尺度声学模型建模框架,基于判决树的自动音素聚类生成了大尺度音素集,利用HMM声学模型训练技术生成了大尺度音素声学上下文相关的背景模型,提高了废料语音的建模精度,还给出了此框架下共享HMM状态的高效搜索空间构造方法,关键词识别准确率平均提高了绝对6.9%;提出了近邻声学上下文准则以及候选关键词在多尺度声学模型上的似然比计算方法并采用FLDA融合,显著提高了声学置信度计算的有效性,系统等错率绝对下降了3.0%。
韩疆刘晓星颜永红张鹏远
关键词:搜索空间
基于多时间尺度特征的语音识别模型被引量:2
2000年
提出了基于多时间尺度特征的语音识别模型 .该模型采用描述谱参数轨迹的段特征 ,在段尺度上实现了对语音信号帧间相关性的显式建模 ;采用段特征依赖的非平稳时间序列产生模型 ,实现了不同尺度特征间的相关性建模 ,并在帧尺度上通过参数化的均值轨迹函数 ,实现了对语音信号帧间相关性的隐式建模 .给出了基于多时间尺度特征联合统计距离优化的分段算法及基于最大似然准则的模型参数估计算法 .识别实验表明 ,该模型的识别性能优于标准HMM及趋势HMM .
韩疆尹宝林
关键词:多时间尺度
一种语音识别系统中的快速解码方法
本发明涉及一种语音识别系统中的快速解码方法。该方法包括下述步骤:(1)对语音识别系统中的解码运算单元进行初始化;(2)从输入解码运算单元中的长度为T的语音特征码字序列中依次取出下一个语音帧的特征码字矢量,置其为t时刻语音...
韩疆颜永红潘接林张建平
文献传递
一种语音识别中的并行搜索方法
本发明公开了一种语音识别中的并行搜索方法,由多个线程对令牌扩展进行并行运算,各线程按索引单位分配得到各自的t-1时刻词典树的令牌资源,对于分配的t-1时刻的令牌资源,线程T<Sub>i</Sub>对各状态的全局令牌链表中...
韩疆庹凌云潘接林刘建颜永红王俊杰
文献传递
基于子带能量的自适应端点检测
端点检测(Endpoint Detection)是语音识别系统的重要组成部分。它的作用是在输入信号中寻找语音的起止点,以提高语音识别的速度和准确率。本文提出一种基于子带能量的自适应端点检测算法。该算法通过统计噪声特征,把...
国雁萌潘接林颜永红韩疆张建平
文献传递
基于音频流的电视智能监测系统设计
2005年
广电总局的电视监测业务已经实现了设备控制自动化和卫星信号采集的数字化、信息化和网络化,但基于内容的异态事件监测和信息处理还是完全依赖人工完成。语音处理、语音识别和关联检索等技术的发展,为电视监测业务智能化提供了可能。本文介绍了电视监测业务智能辅助系统的架构,该系统能够自动定位电视节目,把电视新闻语音转化为文字,对敏感语言内容预警,并关联聚类相关信息,方便人工后续处理。
崔朝阳刘晓星韩疆颜永红
关键词:语音识别说话人识别
口语障碍者的语音特征分析与变换
声音变换技术在语音识别、语音合成、保密通信等领域都有广泛的潜在应用前景。本文将研究如何将不同程度口语障碍者的语音,通过分析和变换转换成另一种更易于听懂的语音。在分析中,我们用线谱频率(LSF)作为参数,用混合高斯模型(G...
张建平潘接林韩疆颜永红
文献传递
基于帧特征、段特征联合建模的语音识别模型被引量:8
2000年
提出了基于帧特征、段特征联合建模的语音识别模型。该模型采用描述谱参数轨迹的段特征,在段尺度上实现了对语音信号帧间相关性的显式建模;采用段特征依赖的非平稳时间序列产生模型,实现了段特征与帧特征间的相关性建模,并在帧尺度上通过参数化的均值轨迹函数,实现了对语音信号帧间相关性的隐式建模。本文给出了基于帧特征、段特征联合统计距离优化的分段算法以及内嵌EM迭代的模型参数估计算法。对非特定人汉语孤立韵母以及多话者汉语基本音节的识别实验表明,该模型的识别性能优于标准HMM及趋势HMM。
韩疆尹宝林
关键词:语音识别汉语
语音识别置信度评价方法和系统及应用该方法的听写装置
本发明公开一种语音识别置信度的评价方法及其系统,其评价方法中利用目标单元的隐马尔可夫模型对所述语音段作强制对齐时,生成所述目标单元的状态音素序列及各状态音素对应语音段的起始边界,基于状态音素关于对应语音段中各语音帧的后验...
韩疆刘建潘接林颜永红庹凌云张建平
文献传递
基于多时间尺度特征的语音识别模型框架
语音识别技术是一种重要的非键盘输入技术.该文针对当前语音系统在语音信号表示和识别模型建构中存在的一些问题,开展了一些研究工作,提出了基于多时间尺度特征的语音识别框架.
韩疆
关键词:语音识别信号模型帧间相关性
文献传递
共3页<123>
聚类工具0