您的位置: 专家智库 > >

关峰

作品数:2 被引量:1H指数:1
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇查询
  • 1篇带权
  • 1篇信息检索
  • 1篇鲁棒
  • 1篇基于查询

机构

  • 2篇中国科学院
  • 2篇中国科学院大...

作者

  • 2篇关峰
  • 2篇刘悦
  • 2篇薛源海
  • 2篇程学旗
  • 2篇俞晓明

传媒

  • 1篇计算机研究与...
  • 1篇中文信息学报

年份

  • 1篇2016
  • 1篇2014
2 条 记 录,以下是 1-2
排序方式:
信息检索中的带权邻近度度量研究被引量:1
2014年
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.
薛源海俞晓明刘悦关峰程学旗
关键词:信息检索
基于查询性能预测的鲁棒检索排序研究
2016年
信息检索技术致力于从海量的信息资源中为用户获取所需的信息。相较于传统的简单模型,近些年来的大量研究工作在提升了检索结果平均质量的同时,往往忽略了鲁棒性的问题,即造成了很多查询的性能下降,导致用户满意度的显著下降。本文提出了一种基于排序学习的查询性能预测方法,针对每一个查询,对多种模型得到的检索结果列表进行预测,将其中预测性能最优的检索结果列表展示给用户。在LETOR的三个标准数据集OHSUMED、MQ2008和MSLR-WEB10K上的一系列对比实验表明,在以经典的BM25模型作为基准的情况下,与当前最好的检索模型之一LambdaMART相比,该方法在提升了检索结果平均质量的同时,显著地减少了性能下降的查询的数量,具备较好的鲁棒性。
薛源海俞晓明刘悦关峰程学旗
共1页<1>
聚类工具0