您的位置: 专家智库 > >

张舸

作品数:3 被引量:20H指数:2
供职机构:中国科学院声学研究所更多>>
发文基金:新疆维吾尔自治区重大科技专项国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 2篇电子电信
  • 2篇自动化与计算...

主题

  • 2篇语音
  • 2篇语音识别
  • 2篇神经网
  • 2篇神经网络
  • 2篇解码
  • 2篇解码器
  • 1篇递归神经
  • 1篇递归神经网络
  • 1篇动态时间规整
  • 1篇异构
  • 1篇异构计算
  • 1篇预处理
  • 1篇跳帧
  • 1篇关键词检索

机构

  • 3篇中国科学院
  • 3篇中国科学院新...
  • 3篇中国科学院大...

作者

  • 3篇张鹏远
  • 3篇颜永红
  • 3篇张舸
  • 2篇潘接林
  • 1篇刘建

传媒

  • 2篇网络新媒体技...
  • 1篇电子与信息学...

年份

  • 2篇2019
  • 1篇2017
3 条 记 录,以下是 1-3
排序方式:
基于异构计算的语音识别解码加速方法被引量:1
2019年
提出一种基于异构计算方法加速基于神经网络声学模型的语音识别解码器的方法。该方法通过GPU和CPU协同计算,利用GPU的浮点运算能力和并行计算能力加速神经网络计算,从而加快语音识别解码过程。为了充分利用计算资源,本文实现了多卡多线程GPU-CPU协同解码系统,并对神经网络计算过程进行了优化,以提升计算并行程度。所提出的加速方法与仅使用CPU的解码方法相比,取得了3倍以上的解码加速比,并保持解码精度不变。
张舸张鹏远张鹏远颜永红
关键词:语音识别解码器异构计算神经网络
基于动态时间规整的语音关键词检索算法被引量:2
2019年
提出一种通过声学模板匹配进行基于音频模板的语音关键词检索算法。该算法通过动态时间规整将音频模板与待检索语音进行匹配,获得音频模板所对应的关键词的出现位置。为了提升匹配质量,本文对音频模板进行筛选和预处理,获得较原始模板更具代表性的多模板作为匹配单元。所提出的音频模板筛选和预处理方法,与直接采用原始模板匹配相比,得到了相对55. 0%的提升。
张舸张鹏远张鹏远颜永红
关键词:关键词检索动态时间规整
基于递归神经网络的语音识别快速解码算法被引量:17
2017年
递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model,HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。
张舸张鹏远潘接林颜永红
关键词:语音识别递归神经网络解码器
共1页<1>
聚类工具0