冯志远
- 作品数:6 被引量:14H指数:2
- 供职机构:中国人民解放军信息工程大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 融合边界信息的语音样例快速检索
- 2013年
- 提出了一种融合音素边界信息的语音样例快速检索方法。该方法首先提取查询样例和测试集的音素后验概率;然后,运用层次凝聚聚类算法将音素后验概率序列分段(即音素边界检测),计算每个分段的平均向量并将其分别组成新查询和新索引,再运用动态时间规整进行语音样例的检索;最后,使用虚拟相关反馈技术对检索结果进行修正。实验结果表明:尽管此方法的检索精度略低于直接运用动态时间规整进行检索的检索精度,但其检索速度大大优于后者,且与其他相关文献提出的方法相比,此方法在检索速度方面也具有明显优势。
- 冯志远张连海
- 关键词:动态时间规整
- 基于音素后验概率和层次凝聚聚类算法的音素边界检测
- 2014年
- 提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。
- 冯志远张连海
- 基于语谱能量的音素边界检测被引量:1
- 2013年
- 根据音素发音时语谱结构的变化提出了一种基于语谱能量的音素边界检测方法。该方法首先根据语谱结构变化特点将信号频域划分为高频、中频、低频3个区域,并以语音帧间语谱能量向量的欧氏距离为判别依据分别对3个区域进行音素边界检测,然后对3个区域检测的边界分别进行二次筛选,最后将3个区域的边界信息融合,得到音素边界检测结果,相对于基于音素属性的边界检测方法,计算复杂性大大降低,边界检测率提高了3.95%。
- 李立永张连海冯志远
- 基于动态时间规整的语音样例快速检索算法被引量:7
- 2014年
- 为了提高基于DTW算法的语音检索系统的速度,提出了一种基于分段累积近似下界估计的动态时间规整算法,实现语音样例快速检索。该方法首先提取查询样例和测试集的音素后验概率作为特征参数,然后计算语音样例和测试集中所有候选分段实际动态规整得分的分段累积近似下界估计,最后采用K-最近邻算法与动态时间规整算法搜索与语音样例相似度最高的区域。实验结果表明,此算法的检索速度比直接运用DTW算法快6.32倍,而对其检索精度无任何影响。
- 张连海冯志远陈琦李勃昊
- 关键词:动态时间规整
- 基于分段动态时间规整的语音样例快速检索被引量:5
- 2014年
- 提出了一种融合下界估计和分段动态时间规整的语音样例快速检索方法。该方法针对缺乏合适的训练数据等语音资源较为有限的语言进行快速检索所设计。此方法首先提取查询样例和测试集的音素后验概率;然后,根据限制条件在测试语句中选定候选分段,并计算查询样例和每个候选分段之间实际动态时间规整得分的下界估计,再运用K最近邻搜索算法搜索与查询样例相似度最高的分段;最后,使用虚拟相关反馈技术对检索结果进行修正。实验结果表明:尽管此方法的检索精度略低于直接运用动态时间规整进行检索的检索精度,但其检索速度优于后者,且检索结果经过虚拟相关反馈技术修正后,其检索精度也得到有效提升。
- 冯志远张连海
- 关键词:下界估计
- 基于模板匹配的语音样例快速检索技术研究
- 语音样例检索是根据用户输入的查询样例(即波形片段),在海量的语音资源中搜索并返回与之相关联的语音片段的过程。它在信息安全、语音搜索引擎以及语音资源的分类管理等领域具有重要的应用价值。基于模板匹配的语音样例检索是当前语音样...
- 冯志远
- 关键词:动态时间规整下界估计
- 文献传递