刘加
- 作品数:221 被引量:847H指数:16
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划北京市自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术语言文字文化科学更多>>
- 置信度的原理及其在语音识别中的应用被引量:21
- 2000年
- 由于置信度模型可以有效地判断观测数据与语音模型之间的匹配程度 ,因此可以用来对语音识别结果进行假设检验 ,定位识别结果中的错误 ,从而提高系统的识别率和稳健性 .讨论了语音识别中置信度的基本原理、估值方法、模型性能评价方法 ,比较全面地介绍了置信度在语音识别中的各种应用 .实验结果表明 ,置信度在语音识别的搜索和剪枝过程、说话人自适应以及拒识和验证方面都有明显的作用 .
- 刘镜刘加
- 关键词:置信度语音识别
- 基于非负矩阵分解的阴影检测方法被引量:1
- 2013年
- 针对以往的矩阵分解方法不能保证分解结果非负的问题,根据非负矩阵分解(NMF:Non-negative Matrix Factorization)结果非负的特点,提出了基于NMF的阴影检测方法,并以此为基础将进一步引入的分块非负矩阵分解(BNMF:Block Non-negative Matrix Factorization)应用于阴影检测。通过NMF/BNMF提取训练样本中阴影的亮度特征,再根据特征识别测试样本中的阴影区域。实验结果表明,与基于奇异值分解方法相比,该算法的阴影检测细节更清晰,具有更好的效果。
- 周鹏宇杨欣周大可刘加
- 关键词:非负矩阵分解
- 汉语连续语音中HMM模型状态数优化方法研究被引量:9
- 2006年
- 为了优化汉语连续语音中HMM模型系统以提高识别性能,提出了分别为每个声母和韵母半音节声学模型选择最优的状态数的方法。通过综合考虑每个声母和韵母半音节声学模型在不同状态数下的段长均值、方差以及各自识别率这三者信息,作为进行最优模型状态数的选择准则。优化后的声学模型系统由状态数各不相同的声母半音节声学模型组成,同未优化前状态数统一的模型系统相比,音节识别性能提高了5.07个百分点。研究表明,每个声母和韵母半音节志学模型应根据情况选择不同的状态数,优化后的模型系统识别性能得到了提高。
- 何珏刘加
- 关键词:中文信息处理声学模型语音识别
- 网络音频数据检索技术被引量:14
- 2007年
- 针对网络海量数据的应用特点,对传统的直方图算法进行了改进,采用基于主轴树的快速矢量量化技术进行预处理,采用两阶段法进行搜索处理,实验结果表明这2种方法可以显著提高检索的速度和精度。
- 张卫强刘加
- 关键词:音频检索矢量量化
- 一种分布式麦克风的说话人聚类方法
- 一种分布式麦克风的说话人聚类方法,先对分布式麦克风采集的信号进行预处理,再对声源信号片段采用时延估计法计算,得到对应的时延估计向量,然后排除错误数据并进行说话人分割,最后根据说话人分割的结果进行说话人聚类,本发明以分布式...
- 杨毅刘加
- 文献传递
- 航班预定口语对话系统的设计与实现
- 2015年
- 介绍一个航班预定口语对话系统的设计与实现,该系统允许用户通过普通话进行航班信息查询与预定.重点介绍口语对话系统中的口语语言理解.为了克服语音识别引入的识别错误导致语义理解错误的问题,提出基于词混淆网络的两阶段中文口语语言理解方法:首先从词混淆网络中选择N元文法作为分类特征,进行主题分类,并通过语义分类模型解析获取对应的语义树结构;然后利用基于规则的语义槽填充器抽取相应的语义槽属性-值.该方法是数据驱动的,训练数据的标记比较容易.实验在汉语航班预定领域进行,结果表明,在语音识别字错误率很高的情况下,该方法比传统的基于语法规则的语言理解方法更加鲁棒,在语义理解正确率方面有明显改善.
- 陈振锋杨晓昊吴蔚澜刘加夏善红
- 关键词:口语对话系统语义理解对话管理
- 嵌入式系统上的实时语音识别算法被引量:12
- 2005年
- 介绍了一种嵌入式系统上的孤立词语音识别算法。该算法基于连续隐含马尔可夫模型,根据嵌入式系统的特点,简化了经典的连续隐含马尔可夫模型,在主流个人数字助理(PDA)上实现了中等规模语音识别的实时处理,采用最大后验概率(M AP)自适应方法解决训练数据采集信道和PDA信道的不匹配问题。在系统的后端处理中,提出了一种基于置信测度的拒识方法改善系统的稳健性,最终使610个孤立词的识别任务,系统的等错误率小于5%;对集内发音拒识率为5%时,集内发音识别率达到95%。
- 丁玉国刘加刘润生
- 关键词:语音识别嵌入式系统
- 基于二次多项式后验概率估计的汉语数码语音识别
- 1999年
- 本文提出了一种可在8位单片机上实现的非特定人汉语数码识别算法。该算法基于最大后验概率分类原理,利用二次多项式估计后验概率分布。其优点是识别算法简单,不涉及动态规划过程。又针对易混淆的集合设计了包括优选、拒识策略的两级结构,实验证明本算法达到了实用水平。
- 史媛媛刘加刘润生
- 关键词:后验概率语音识别
- 基于语音识别专用芯片的非特定人语音识别、语音提示方法
- 本发明属于语音技术领域,包括:非特定人语音识别的预先训练、语音识别参数提取、非特定人语音命令的识别、非特定人语音识别的说话人自适应学习、语音提示。本识别方法具有方法简单、识别率高、稳健性好等特点。构成的系统可以用于玩具控...
- 刘加李晓宇史缓缓刘润生
- 文献传递
- 利用多层感知机映射提高不匹配环境下的语音识别性能被引量:1
- 1999年
- 本文提出了一种提高不匹配环境下的语音识别性能的方法。该方法基于多层感知机映射,采用最大似然一后向传播(ML-BP)算法,利用少量测试环境下的语音进行训练,实现训练环境与测试环境的语音特征空间或模型空间之间的映射。实验证明,采用了本文提出的算法后,测试环境下的语音识别性能有了很大的提高。
- 李虎生刘加刘润生
- 关键词:多层感知机语音识别映射