您的位置: 专家智库 > >

薛晔伟

作品数:2 被引量:17H指数:1
供职机构:西安交通大学电子与信息工程学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇搜索
  • 2篇网页
  • 2篇网页搜索
  • 1篇英文
  • 1篇字符
  • 1篇字符串
  • 1篇字符串匹配
  • 1篇网页特征
  • 1篇串匹配

机构

  • 2篇西安交通大学

作者

  • 2篇张云
  • 2篇薛晔伟
  • 2篇沈钧毅
  • 1篇鲍军鹏

传媒

  • 1篇西安交通大学...
  • 1篇Journa...

年份

  • 2篇2008
2 条 记 录,以下是 1-2
排序方式:
一种编辑距离算法及其在网页搜索中的应用被引量:17
2008年
针对传统方法不能很好地处理网页中简短域与用户查询之间的相关性排序问题,提出一种基于改进的编辑距离排序算法.将以词为单位的用户查询和简短网页域通过匹配编码转化为2个字符串,再利用改进的编辑距离计算2个字符串之间的相似性.由于在用户查询与待比较的简短网页域之间引入了查询词分布的位置、顺序和距离等,以及含有查询词修饰关系的重要信息,所以编码字符串之间的相似程度可以衡量对应的查询与简短网页域之间的相关性.经大规模真实搜索引擎实验表明,该算法较之传统的相关性排序算法,可以显著地提高网页搜索中的简短网页域相关性排序性能,尤其适用于简短域与用户查询之间的相关性比较.
薛晔伟沈钧毅张云
关键词:网页搜索字符串匹配
网页特征获取方法及其在网页搜索中的应用(英文)被引量:1
2008年
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.
薛晔伟沈钧毅张云鲍军鹏
关键词:网页搜索
共1页<1>
聚类工具0