您的位置: 专家智库 > >

杜晶

作品数:3 被引量:0H指数:0
供职机构:西北工业大学计算机学院更多>>
发文基金:国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇搜索
  • 2篇查询
  • 1篇信息检索
  • 1篇遗传算法
  • 1篇引擎
  • 1篇知识获取
  • 1篇识别方法
  • 1篇搜索引擎
  • 1篇索引
  • 1篇探针
  • 1篇图结构
  • 1篇自动识别
  • 1篇自动识别方法
  • 1篇基于WEB
  • 1篇基于遗传算法
  • 1篇关键词
  • 1篇WEB
  • 1篇WEB搜索

机构

  • 3篇西北工业大学

作者

  • 3篇刘海龙
  • 3篇陈群
  • 3篇杜晶
  • 2篇李战怀
  • 2篇徐曜
  • 2篇胡嘉琪
  • 1篇赵政文

传媒

  • 1篇计算机工程与...
  • 1篇计算机与现代...
  • 1篇计算机科学

年份

  • 1篇2015
  • 1篇2014
  • 1篇2013
3 条 记 录,以下是 1-3
排序方式:
一种基于遗传算法的查询关键词形成技术
2013年
分析针对离散的关系数据构造有效查询关键词的关键因素,并在此基础上提出一种基于遗传算法的查询关键词形成方法 GQFA(Genetic-based Query Forming Algorithm)。对于目标属性,在训练集上应用遗传算法,学习得到与目标属性强相关的属性子集,进而形成合适的查询关键词。实验结果表明,该方法形成的查询关键词能够较好地满足应用需求。
杜晶陈群刘海龙
关键词:查询遗传算法知识获取信息检索
一种基于图结构的Web实体排序方法
2014年
现阶段,用户常常希望利用搜索引擎获得期望的实体,然而传统搜索引擎只能返回包含关键字的多个文档,并不能直接返回用户想要的答案,且现有的实体排序技术主要采用权值叠加的方法,需要很多先验知识对权值进行训练。文中从搜索引擎返回的文档中提取多个候选实体,并提出一种基于图结构的算法PERA(Probabilistic Entity Ranking Algorithm),利用随机游走的思想,在不需要知道相关先验知识的情况下,将候选实体排序。经过实验验证,各个类型的正确实体均有着较高的排序分值。
徐曜赵政文陈群刘海龙杜晶胡嘉琪李战怀
关键词:WEB搜索引擎
基于Web的重复属性自动识别方法
2015年
在建立数据仓库的过程中,需要从多个数据源导入数据。这些数据存在大量相似重复记录,严重影响了数据利用率和决策质量。因此,相似重复记录的检测已经成为数据仓库等领域的热点研究问题,而重复属性的识别是完成相似重复记录检测的关键。提出一种高效的基于Web的重复属性自动识别算法,该算法使用搜索引擎返回的摘要和URL信息计算属性相似度,并使用查询探针提高查询准确度。实验结果表明该算法有较高的查全率。
胡嘉琪陈群刘海龙杜晶徐曜李战怀
关键词:WEB搜索
共1页<1>
聚类工具0