您的位置: 专家智库 > >

国家自然科学基金(61175017)

作品数:43 被引量:110H指数:5
相关作者:张连海屈丹李弼程张文林牛铜更多>>
相关机构:解放军信息工程大学中国人民解放军信息工程大学中国人民解放军更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国防科技技术预先研究基金更多>>
相关领域:自动化与计算机技术电子电信理学更多>>

文献类型

  • 43篇期刊文章
  • 2篇会议论文

领域

  • 26篇自动化与计算...
  • 19篇电子电信
  • 1篇理学

主题

  • 24篇语音
  • 14篇语音识别
  • 9篇后验概率
  • 6篇音素
  • 5篇样例
  • 5篇网络
  • 5篇关键词检测
  • 4篇音素识别
  • 4篇神经网
  • 4篇神经网络
  • 4篇区分性
  • 4篇自动语音识别
  • 4篇聚类
  • 4篇查询
  • 4篇词格
  • 3篇动态时间规整
  • 3篇循环神经网络
  • 3篇音位
  • 3篇语言模型
  • 3篇语音查询

机构

  • 31篇解放军信息工...
  • 12篇中国人民解放...
  • 1篇中国人民解放...
  • 1篇中国人民解放...

作者

  • 30篇张连海
  • 22篇屈丹
  • 11篇李弼程
  • 8篇张文林
  • 8篇牛铜
  • 7篇陈斌
  • 5篇冯志远
  • 5篇郑永军
  • 4篇陈琦
  • 4篇许友亮
  • 3篇陆明明
  • 3篇陆梨花
  • 2篇张剑
  • 2篇李立永
  • 2篇李真
  • 2篇李鹏
  • 2篇张力
  • 2篇李勃昊
  • 1篇王炳锡
  • 1篇徐双印

传媒

  • 8篇信息工程大学...
  • 7篇数据采集与处...
  • 6篇信号处理
  • 4篇自动化学报
  • 4篇模式识别与人...
  • 3篇声学学报
  • 3篇太赫兹科学与...
  • 2篇计算机工程
  • 2篇应用科学学报
  • 1篇电子与信息学...
  • 1篇计算机应用研...
  • 1篇中文信息学报
  • 1篇计算机工程与...

年份

  • 1篇2017
  • 5篇2016
  • 8篇2015
  • 14篇2014
  • 8篇2013
  • 9篇2012
43 条 记 录,以下是 1-10
排序方式:
融合边界信息的语音样例快速检索
2013年
提出了一种融合音素边界信息的语音样例快速检索方法。该方法首先提取查询样例和测试集的音素后验概率;然后,运用层次凝聚聚类算法将音素后验概率序列分段(即音素边界检测),计算每个分段的平均向量并将其分别组成新查询和新索引,再运用动态时间规整进行语音样例的检索;最后,使用虚拟相关反馈技术对检索结果进行修正。实验结果表明:尽管此方法的检索精度略低于直接运用动态时间规整进行检索的检索精度,但其检索速度大大优于后者,且与其他相关文献提出的方法相比,此方法在检索速度方面也具有明显优势。
冯志远张连海
关键词:动态时间规整
采用逼近优化的提升大边距估计准则
2013年
针对大边距估计(Large Margin Estimation,LME)准则仅选取支持集内的最小边距进行调整导致边距利用不合理的问题,本文提出一种大边距准则目标函数的改进形式,通过增强竞争假设中与正确标注竞争关系较强的路径的似然得分,使训练数据的分类边距在一定程度上变小,从而进一步提高大边距估计的训练效果。并在此基础上,提出一种新的逼近优化方法,即当某点目标函数与辅助函数梯度方向相同时,在该点邻近的一定范围内,优化辅助函数即可带来目标函数相应的优化。在微软语料库上的实验成功证明了本文算法的有效性。
徐双印屈丹
关键词:辅助函数
声学模型区分性训练中的动态加权数据选取方法
2014年
提出了一种基于动态加权的数据选取方法,并应用到连续语音识别的声学模型区分性训练中.该方法联合后验概率和音素准确率选取数据,首先,采用后验概率的Beam算法裁剪词图,在此基础上依据候选词所在候选路径的错误率,基于后验概率动态的赋予候选词不同的权值;其次,通过统计音素对之间的混淆程度,给易混淆音素对动态地加以不同的惩罚权重,计算音素准确率;最后,在估计得到弧段期望准确率分布的基础上,采用高斯函数形式对所有竞争弧段的期望音素准确率软加权.实验结果表明,与最小音素错误准则相比,该动态加权方法识别准确率提高了0.61%,可有效减少训练时间.
陈斌牛铜张连海李弼程屈丹
关键词:语音识别动态加权
基于子词PSPL的汉语语音文档索引
2013年
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索.实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法.
陆明明张连海屈丹
关键词:词格
一种基于改进得分分布的查询项特定阈值方法
2015年
为提高语音查询项检索系统的准确率,提出一种基于改进得分分布的查询项特定阈值方法.在系统判决阶段,根据每个查询项的后验得分分布设定不同阈值.后验得分分布用指数混合模型描述,通过无监督的最大期望(EM)算法估计模型参数,最后根据贝叶斯最小风险准则计算阈值.针对EM算法对初始值较为敏感的问题,初始化时采用K-means聚类算法代替随机初始化方法,首先将候选结果得分分为两类,然后计算每类的先验分布并用最大似然法估计模型参数的初始值.实验结果表明该阈值方法有更好的检索性能.
陆梨花张连海
关键词:K-MEANS聚类
基于子空间映射和得分规整的GSV-SVM方言识别被引量:1
2013年
为了提高语音识别中方言识别由于差异性小混淆度高造成识别率低的问题,针对汉语普通话、青海方言和藏语安多方言设计一个基于子空间映射和分数归一化技术的GSV-SVM方言识别系统。利用最大后验概率准则自适应生成KL核的GSV,对GSV进行低维子空间映射;再利用映射后的空间训练多SVM模型进行得分域规整与识别。实验结果表明,采用该系统可以有效对混淆度高的方言进行识别。
王烨屈丹李弼程刘崧
关键词:主分量分析线性判别分析
基于加权有限状态转换器的语音查询项检索技术被引量:2
2015年
为了提高语音查询项检索效率,提出了一种在加权有限状态转换器(Weighted finite-state transducer,WFST)框架下以混淆网络代替词格建立索引的技术。在索引建立阶段,首先将词格转化为混淆网络并用自动机形式表示,然后利用自动机构建基于时间的因子转换器,最后将所有因子转换器进行联合及优化得到索引。在查询阶段,将查询项转化为自动机形式后与索引进行合成运算得到表示查询结果的自动机。实验结果表明,在保证系统检测正确率的前提下,与直接以词格建立的WFST索引相比,以混淆网络建立的WFST索引尺寸更小,检索速度更快,因而系统性能更好。
陆梨花张连海陈琦
关键词:混淆网络
语音识别中基于低秩约束的本征音子说话人自适应方法被引量:3
2014年
该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还要差。首先,对协方差矩阵为对角阵的隐马尔可夫-高斯混合模型语音识别系统,推导出一种简化的本征音子矩阵估计算法;然后,对本征音子矩阵引入低秩约束,采用矩阵的核范数作为矩阵秩的凸近似,通过调节核范数的权重因子以有效控制自适应模型的复杂度;最后,给出一种加速近点梯度算法以求解新算法中引入的带有核范数正则项的数学优化问题。汉语连续语音识别的说话人自适应实验表明,引入低秩约束后,本征音子说话人自适应方法的自适应效果得到了明显提高,在5~50 s的自适应数据条件下,均取得了比最大似然线性回归后接最大后验(MLLR+MAP)自适应更佳的识别效果。
张文林张连海陈琦李弼程
关键词:语音识别说话人自适应
基于语速调整和音位属性后验概率的音素识别被引量:5
2012年
基于语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算法。该算法以语句为单位,采用连续变化的帧长与帧移间隔对语句进行归一化调整,使调整后速率与语料库平均速率一致,减小速率因素对模型训练的影响;另外,通过计算音位属性的后验概率向量间夹角,得到测试集的语速,相比采用训练模型的语速检测方法减轻了系统负担。本文将语速调整算法应用于音位属性的提取,并对音位属性特征进行非线性变换,最后采用隐马尔科夫模型进行建模,实验表明:经过语速调整后,音素的平均持续帧数较为恒定,动态变化范围减小,使得音素识别率提升了1.3%。
许友亮张连海张文林李永彬
关键词:隐马尔可夫模型自动语音识别
基于动态时间规整的语音样例快速检索算法被引量:7
2014年
为了提高基于DTW算法的语音检索系统的速度,提出了一种基于分段累积近似下界估计的动态时间规整算法,实现语音样例快速检索。该方法首先提取查询样例和测试集的音素后验概率作为特征参数,然后计算语音样例和测试集中所有候选分段实际动态规整得分的分段累积近似下界估计,最后采用K-最近邻算法与动态时间规整算法搜索与语音样例相似度最高的区域。实验结果表明,此算法的检索速度比直接运用DTW算法快6.32倍,而对其检索精度无任何影响。
张连海冯志远陈琦李勃昊
关键词:动态时间规整
共5页<12345>
聚类工具0