黑龙江省自然科学基金(F200936) 作品数:13 被引量:34 H指数:3 相关作者: 孙广路 郎非 何勇军 鲁颖欣 齐宏卓 更多>> 相关机构: 哈尔滨理工大学 清华大学 哈尔滨工业大学 更多>> 发文基金: 黑龙江省自然科学基金 国家自然科学基金 黑龙江省教育厅科学技术研究项目 更多>> 相关领域: 自动化与计算机技术 电子电信 医药卫生 语言文字 更多>>
数据不充分情况下的说话人识别 被引量:1 2017年 在过去的数十年里,研究者们对说话人识别进行了广泛而深入的研究,提出了许多有效的方法。目前主流的说话人识别方法如高斯混合-通用背景模型(Gaussian mixture model-Universal background model,GMM-UBM)和高斯混合-支持向量机模型(Gaussian mixture model-Support vector machine,GMM-SVM),虽然能取得比较理想的识别效果,但都需要充分的训练和测试数据。而这一要求在现实应用中通常难以满足,导致其识别率急剧降低。针对这一问题,提出了一种基于稀疏编码的说话人识别方法。该方法在训练阶段为每个说话人训练一个语音字典;在识别阶段,将测试语音分别表示在每个字典上然后根据重构误差打分。实验表明,在少量无噪的训练和测试语音数据情况下,所提出的方法取得了比GMM-UBM和GMM-SVM更好的识别效果。 盖晁旭 梁隆恺 何勇军关键词:说话人识别 高斯混合 支持向量机 基于稀疏编码的鲁棒说话人识别 被引量:3 2014年 目前的说话人识别系统在噪声环境下性能将急剧下降,为了解决这一问题,提出了一种新的基于稀疏编码的说话人识别方法。该方法用一个通用背景字典(Universal background dictionary,UBD)刻画说话人语音的共性,并为每个说话人和环境噪声训练相应的字典来刻画说话人和环境的特殊变化。这些字典被拼接成一个大字典,然后将待测试语音稀疏分解在这个大字典上以实现说话人识别。为了提高说话人字典的区分能力,通过从说话人字典中移除与通用背景字典原子相似的原子来优化说话人字典。为了跟踪变化的噪声,采用混噪语音在线更新噪声字典。在各种噪声条件下的实验表明,所提出的方法在噪声环境下具有较强的鲁棒性。 何勇军 孙广路 付茂国 韩纪庆关键词:说话人识别 语音特征增强方法综述 被引量:3 2014年 经过数十年的发展语音识别取得了长足进步,但各种语音识别系统的性能仍然难以满足现实应用的需求.造成这种情况的一个重要原因在于目前的系统仍然难以适应各种噪声环境.因此,增强语音识别系统的噪声鲁棒性是推动其走向现实应用的关键.系统地阐述了特征增强类方法的国内外研究现状,介绍了信号增强、从听觉层面或可区分层面的提取特征、特征归正和特征补偿等方法,分析了他们存在的局限性.在此基础上,分析了稀疏编码与语音特征增强的基本问题和研究现状,提出了稀疏编码在语音特征增强方面的需要解决的问题,为从事鲁棒语音识别的研究者提供参考. 何勇军 付茂国 孙广路关键词:鲁棒性 语音识别 基于TCP Vegas拥塞控制算法的研究与改进 被引量:3 2011年 网络拥塞已经成为制约因特网发展的瓶颈.在众多TCP拥塞控制算法中,TCP Vegas表现出比其他算法更为优越的性能,但是在特定环境下也存在不足.本文通过对网络拥塞策略的研究和Vegas性能的分析,验证了Vegas整体性能优于Reno的结论,并通过分析Vegas的特点,针对α和β的值对公平性的影响,提出了一种在TCP Vegas与TCP Reno共存环境下获得良好拥塞控制的方法,并通过网络仿真证明了本方法的有效性和正确性. 谢怡宁 孙广路 苏洁 翟继强关键词:网络拥塞 TCP VEGAS 模糊判断在网络安全风险评估中的应用研究 被引量:9 2014年 针对网络安全风险评估过程中的模糊性问题,在分析了网络安全风险要素的基础上,将模糊判断运用于网络安全风险评估中,利用模糊隶属度理论把定性指标合理的定量化,进而将定性与定量评价相结合,得到了一种综合化程度较高的评价方法.最后以示例来说明模糊评价法的具体应用. 鲁颖欣 王健 齐宏卓关键词:风险评估 网络安全 基于合并因子的多种格式文件索引技术 被引量:2 2012年 为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件索引技术,并在此基础上构建了中文文本信息检索系统.实验分析表明,本系统有效地实现了多种格式文件检索功能,通过合并因子的设定有效提高了索引速度,系统可靠性高. 孙广路 易成岐 郎非关键词:文本检索 基于混合方法的流量测量系统(英文) 被引量:5 2011年 流量测量是流量控制和管理中的关键问题。传统方法对于当今网络中大量出现的具备动态端口、加密载荷信息或未知协议载荷特征等特点的流量无法进行有效地测量。虽然基于机器学习模型的测量方法能够在一定程度上解决上述问题,但是由于现有特征的区分能力有限,该类方法单独使用时,难以在大规模的真实网络流量中准确地测量出某种特定协议的流量。为了解决流量测量问题,提出了基于混合方法的流量测量系统,融合了基于端口、基于特征串匹配、基于正则表达式匹配和基于机器学习模型的多种流量测量方法。在构建系统框架和相关模块的基础上,应用一种混合方法解决了基于安全套接层协议的流量测量和应用层协议分析问题。实验结果表明,该混合方法能够测量出超过99%的基于安全套接层协议的流量,并有效地分析其中不同应用层协议的流量,准确率达到93.76%。此外,在稳定而可行的内存占用率下,系统能够良好运行,总体测量结果优于开源软件OpenDPI的结果。 孙广路 郎非 杨明明关键词:机器学习模型 企业级搜索引擎中结果聚类和查询补全技术 2012年 目前,搜索引擎技术发展迅速.但从用户的使用效果来看,传统的搜索引擎技术功能基本相似,在具体实现上仍有待提高.从提升用户体验角度出发,解决传统搜索引擎的搜索结果不能体现类别信息,并且搜索过程没有相应的智能提示的问题.研究基于Nutch的检索技术的特性和应用方法,实现了企业级搜索引擎中的搜索结果自动聚类和查询补全技术.实验结果表明,结果聚类和查询补全技术有效地提升了搜索引擎的搜索体验,增强了系统的使用价值和智能性,系统可靠性高. 刘强 吴雨桐 郎非关键词:企业级搜索引擎 搜索结果聚类 语料库语言学与英语词汇教学 被引量:2 2010年 语言教学中词汇教学法的核心是词汇搭配和惯用语。针对当前英语词汇教学的教学目标,研究发现基于语料库的索引功能(KWIC)。语料库能够在常见的词汇搭配形式和习惯用语,固定和半固定的短语及其变化形式、特殊形式出现的频率和常用程度等方面满足学习者的学习需求。此外,研究还发现通过对比使用国外真实英语语料库(Collins Word banks Online English corpus)和中国学习者英语语料库(CLEC)并对所选取的语料库数据进行分析,语料库还能帮助教学者创建适用于学习者实际英语水平的词汇教学内容。 郎非关键词:语料库 索引功能 词汇教学 一种鲁棒的说话人识别新特征 2013年 说话人识别系统不可避免地会受到噪声的影响,导致性能急剧降低,针对这一问题采用感知最小方差无畸变响应(PMVDR)技术,提出了一种新的语音特征提取方法.该特征基于平移差分倒谱算法,成功地融入了说话人语音的长时信息.所提取的特征不仅在干净环境下能取得良好性能,而且在混噪语音以及信道失配等声学条件下也优于目前主流的特征.在YOHO数据库和ROSSI数据库上的实验结果表明,新特征在噪声和信道畸变的情况下能有效提高识别系统的鲁棒性. 谢怡宁 黄金杰关键词:说话人识别 特征提取 语音特征 噪声 鲁棒性