齐浩亮
- 作品数:67 被引量:54H指数:4
- 供职机构:黑龙江工程学院更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金黑龙江省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 基于回归支持向量机的信息检索
- 从本质上看,信息检索应按照文档满足用户信息需求程度进行排序,因此当前以分类和排序策略为主流的研究方式存在与信息检索目标相关性较弱的缺点。本文尝试使用回归分析策略,以文档满足用户的信息需求程度作为回归分析的目标值,利用回归...
- 韩咏齐浩亮杨沐昀李生
- 关键词:信息检索支持向量机
- 文献传递
- 基于词汇时间分布的微博查询扩展被引量:10
- 2016年
- 该文提出了一种面向微博检索的基于词汇时间分布的查询扩展方法.该方法利用扩展词与查询词的时间分布的相似性来度量扩展词与查询词之间的相关度,建立了基于词汇时间分布的查询模型.具体而言,该文在提出词汇时间分布的定义和估计方法的基础上,给出了查询词与扩展词的时间分布相似性的度量,以此作为它们的相关度,完成扩展词的选择和查询模型的重估.该文方法利用时间信息而不是内容来扩展查询,避免了基于内容的查询扩展方法因微博内容短而无法准确估计扩展词的不足.由TREC 2011和TREC 2012微博检索评测数据上的实验结果表明,基于词汇时间分布的查询扩展模型有效地提高了微博检索的性能,不仅显著优于经典的基于内容的查询扩展模型,而且优于其他利用时间进行查询扩展的方法.
- 韩中元杨沐昀孔蕾蕾齐浩亮李生
- 关键词:查询扩展查询模型社交网络社会媒体
- 基于回归支持向量机的信息检索
- 2010年
- 使用回归分析策略以文档满足用户的信息需求程度作为回归分析的目标值,利用回归支持向量机构建了信息检索模型.新模型不仅提供了融合不同来源特征的灵活框架,而且由于使用回归支持向量机寻找具有ε不敏感损失的回归函数,因此具有良好的泛化性能.实验表明,新模型性能优于目前主流的基于语言模型的信息检索方法.
- 韩咏齐浩亮杨沐昀李生
- 关键词:信息检索支持向量机
- 面向信息检索的近邻语言模型被引量:2
- 2011年
- 面向信息检索的语言模型对单篇文档构建语言模型,存在较严重的数据稀疏问题。该文认为利用文档的近邻信息能够更合理地反映词在文档中的分布,有助于数据稀疏问题的解决,因此将文档的近邻信息加入语言模型的平滑算法中,提出近邻语言模型。该文在TREC评测的典型文档集美国能源署文件(DOE)和《华尔街日报》(WSJ)数据集上测试了在不同近邻选择来源上近邻语言模型的性能。实验结果表明,近邻语言模型对检索性能有一定的提升。
- 韩中元李生齐浩亮杨沐昀
- 关键词:信息检索语言模型
- 科技论文原创性检查系统的研究
- 网络的发展为人们共享信息提供了前所未有的条件,然而这也为科技论文抄袭行为提供了便利,于是判定科技论文的原创性变得尤为重要。针对这一问题,本文提出并实现了基于信息检索技术的中文科技论文的原创性检查系统。本文采用n元文法结构...
- 韩咏孔蕾蕾齐浩亮
- 关键词:信息检索
- 文献传递
- 一种基于历史微博的微博实时过滤模型
- 一种基于历史微博的微博实时过滤模型,涉及微博过滤技术领域。本发明为了解决现有技术中基于分类的微博过滤模型存在早期分类面不准的问题、以及基于检索的微博实时过滤模型存在无法保证最优化问题,且现有技术中也没有提供将二者有效融合...
- 韩中元孔蕾蕾杨沐昀齐浩亮李生
- 文献传递
- 一种具有防辐射功能的计算机
- 本实用新型公开了一种具有防辐射功能的计算机,包括机体,所述机体的前端通过转轴连接有机盖,所述机盖的内侧表面设有显示屏,所述机体的上表面设有键盘,所述显示屏的外侧表面贴有防辐射膜,所述机盖的内侧表面边缘安装有光电传感器和第...
- 邓红吴长伟齐浩亮
- 文献传递
- 基于在线线性判别学习模型的垃圾邮件过滤方法
- 2008年
- 给出了一种使用在线线性判别学习模型进行垃圾邮件过滤的方法,使用贝叶斯理论进行特征提取,特征按出现的位置进行分类,不同类别的特征赋予不同的权重.在TREC测试集上进行了实验,并和TREC评测的结果进行了对比.实验结果表明,该方法取得了较好的结果.
- 李军齐浩亮韩中元雷国华
- 关键词:垃圾邮件过滤特征提取贝叶斯理论
- 基于字节级n元文法的特征提取方法及垃圾邮件过滤器
- 基于字节级n元文法的特征提取方法及垃圾邮件过滤器,涉及到包括垃圾邮件过滤技术在内的信息处理技术领域。它解决了现有文本特征提取方法中存在的需要词库支持,并不能够同时适应对英文、汉字、图形以及其它形式信息的特征提取、鉴别的问...
- 齐浩亮何晓宁杨沐昀韩咏李生雷国华李军安波
- 文献传递
- 一种面向微博检索的基于时间的微博文档扩展方法
- 面向微博检索的基于时间的微博文档扩展方法,涉及微博检索技术领域。本发明为了解决微博短给文档扩展带来的不利影响会削弱文档扩展对估计微博文档模型的作用,从而限制微博检索性能的提升的问题。本发明利用相关微博的时间特性扩展文档,...
- 韩中元孔蕾蕾杨沐昀齐浩亮李生
- 文献传递