您的位置: 专家智库 > >

范举

作品数:6 被引量:33H指数:3
供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 6篇自动化与计算...

主题

  • 4篇数据库
  • 4篇查询
  • 3篇关键词查询
  • 2篇数据库选择
  • 2篇基于关键词
  • 2篇关键词
  • 1篇语义距离
  • 1篇知识库
  • 1篇搜索
  • 1篇搜索方法
  • 1篇文本数据
  • 1篇接口
  • 1篇空间数据
  • 1篇关键词检索
  • 1篇关系数据库
  • 1篇TOP-K
  • 1篇查询接口
  • 1篇查询推荐

机构

  • 6篇清华大学

作者

  • 6篇范举
  • 4篇周立柱
  • 1篇李国良
  • 1篇韩军
  • 1篇陈姗姗
  • 1篇刘玉奎
  • 1篇胡骏

传媒

  • 3篇计算机学报
  • 1篇计算机研究与...

年份

  • 1篇2015
  • 2篇2012
  • 3篇2011
6 条 记 录,以下是 1-6
排序方式:
空间数据上Top-k关键词模糊查询算法被引量:15
2012年
基于位置的服务(LBS)变得日益普及,越来越多的研究开始关注如何对空间中的兴趣点(POI)做有效的检索.现有的方法提出了空间数据上的关键词检索,研究如何根据查询的位置和关键词找到相关的POI点.然而,现有方法主要对查询关键词进行精确匹配,不能支持模糊查询:当查询关键词与底层数据存在微小差异的时候,LBS系统不能返回相关的结果.为了满足移动用户的模糊查询需求,文中对空间数据上的Top-k关键词模糊查询问题进行研究:给定一组POI点,检索与查询关键词近似匹配且空间上距离相近的Top-k个结果.为了提供高效的模糊查询,文中首先定义了一种新型的相关性函数,综合考虑了文本相似性和空间距离,进而提出了一种有效的索引结构RegionTrie,并基于RegionTrie设计了高效的Top-k算法.真实数据集上的实验结果表明,文中提出的Top-k算法十分高效,性能远好于对比方法.
胡骏范举李国良陈姗姗
一种语义增强的空间关键词搜索方法被引量:3
2015年
空间关键词搜索立足于查找满足用户查询意图且空间距离相近的兴趣点(point of interest,POI),在地图搜索等领域有着广泛的应用.传统的空间关键词搜索方法仅考虑关键词与POI点在文本上的匹配程度,忽略了查询的语义信息,因而会导致相关结果丢失以及无关结果引入等问题.针对传统方法的局限,提出了语义增强的空间关键词搜索方法 S3(semantic-enhanced spatial keyword search).该方法对查询关键词中包含的语义信息进行分析,并结合语义相关性和空间距离对POI点进行有效的排序.S3方法主要有以下2个技术挑战:1)如何对语义信息进行分析.为此,S3引入了知识库对POI数据进行语义扩充,并提出了一种基于图的语义距离度量方式.结合语义距离和空间距离,S3给出POI点的综合排序方案.2)如何在大规模数据上即时地返回top-k搜索结果.针对这一挑战,提出了一种新型的语义-空间混合索引结构GRTree(graph rectangle tree),并研究了有效的剪枝策略.在大规模真实数据集上的实验表明,S3不仅能够返回更为相关的结果,而且有着很好的效率和可扩展性.
韩军范举周立柱
关键词:搜索知识库语义距离
基于关键词的深度万维网数据库选择被引量:11
2011年
该文提出一种基于关键词的深度万维网查询方法:用户用关键词的方式提交查询,该方法在线地选择能够反映查询意图并且提供高质量结果的万维网数据库.这种方法既避免了深度万维网数据抓取这一代价高、难度大的操作,又可支持多领域的数据库上的关键词查询,从而能够与现有的搜索引擎实现无缝集成.文中侧重于讨论基于关键词的数据库选择,从以下两个方面解决这一问题所涉及的挑战:(1)提出了一种度量关键词-领域属性关联的相关性模型,并设计了基于随机游动的算法从查询日志中发现潜在的关键词-属性关联;(2)给出了一种新的数据采样方法,并用于基于采样的数据库-查询的相关性模型中,最终解决深度万维网的数据库选择问题.在中文深度万维网真实数据集上的实验表明:提出的方法能够有效地选择与关键词查询相关的数据库,提供高质量的结果.
范举周立柱
关键词:关键词查询数据库选择
基于关键词的深度万维网数据库选择
本文提出一种基于关键词的深度万维网查询方法:用户用关键词的方式提交查询,该方法在线地选择能够反映查询意图并且提供高质量结果的万维网数据库。这种方法既避免了深度万维网数据抓取这一代价高、难度大的操作,又可支持多领域的数据库...
范举周立柱
关键词:关键词查询数据库选择
中文深度万维网数据库的现状研究被引量:7
2011年
深度万维网(Deep Web)已成为万维网上十分重要的资源,是数据库领域的研究热点.目前已有的多数研究主要集中在深度万维网发现、查询接口集成以及查询结果处理等技术层面.然而对于这个超出表面万维网所涵盖信息数百倍的宝贵资源,人们目前还缺乏足够的了解和认识.对于一些基本问题,例如:(1)中文深度万维网的具体规模有多大;(2)中文深度万维网在各个领域上的分布如何等,目前还没有人能给出一个明确的回答.针对这一状况,文中采用数据挖掘中的分类技术,对中文万维网上的深度万维网进行识别,并将其按所在领域的不同进行划分,对以上提到的两个基本问题给出了客观的度量,并对中文深度万维网的现状作了一些相关的统计.文中将主要介绍以100万中文万维网网站首页数据为基础,如何采用分类的技术来解答以上提到的两个问题.实验结果表明,当前中文万维网上,拥有60多万个深度万维网查询接口,其中一半以上属于商业领域,这比较客观地反应了当前我国万维网的使用现状.同时,中文深度万维网中复杂查询接口和简单查询接口约各占一半,而当前的研究主要集中在对复杂查询接口上,对简单查询接口的研究却相对较少,这一结论提醒我们在今后要加强对简单查询接口的相关研究.
刘玉奎周立柱范举
关键词:数据库查询接口
关键词查询的推荐技术研究
关键词查询是文本数据(如万维网等)的经典查询方式,它只需用户输入简单的关键词即可得到结果,省去了学习查询语言和了解底层数据的负担。因其良好的易用性,关键词查询在结构化数据(如关系数据库和深度万维网数据库)上同样得到了广泛...
范举
关键词:文本数据关系数据库关键词查询查询推荐
共1页<1>
聚类工具0