您的位置: 专家智库 > >

郑冬冬

作品数:6 被引量:95H指数:5
供职机构:苏州大学计算机科学与技术学院智能化信息处理技术研究所更多>>
发文基金:国家教育部博士点基金江苏省高技术研究计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 6篇自动化与计算...

主题

  • 5篇DEEP_W...
  • 4篇爬虫
  • 3篇查询
  • 2篇信息集成
  • 2篇DEEPWE...
  • 1篇信息集成系统
  • 1篇页面
  • 1篇引擎
  • 1篇用户
  • 1篇用户兴趣
  • 1篇元搜索
  • 1篇元搜索引擎
  • 1篇数据库
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇接口
  • 1篇接口对象
  • 1篇个性化
  • 1篇WEB

机构

  • 6篇苏州大学

作者

  • 6篇郑冬冬
  • 5篇崔志明
  • 2篇赵朋朋
  • 1篇徐科

传媒

  • 1篇清华大学学报...
  • 1篇微电子学与计...
  • 1篇计算机应用
  • 1篇计算机工程与...
  • 1篇第三届全国搜...

年份

  • 4篇2006
  • 2篇2005
6 条 记 录,以下是 1-6
排序方式:
Deep Web查询接口选择被引量:12
2006年
越来越多的信息隐藏在W eb查询接口之后,在此情况下如何寻找与用户查询最相关的数据源接口就变得越来越重要。文中提出了一种Deep W eb查询接口选择算法,该算法是完全依赖于查询接口特征的。给定大量异构的Deep W eb数据源,目标是选择与用户查询最相关的查询接口集。通过对实际查询接口特征的观察,发现了查询接口上谓词间的相关性。基于此发现,设计了一种基于共同出现谓词相关度模型的数据源选择算法,用于选择与用户查询最相关的查询接口集。
郑冬冬崔志明
关键词:接口对象
元搜索引擎中基于用户兴趣的查询结果合成研究被引量:13
2006年
元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是它们返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量,也大大提高了用户检索的代价。针对这一问题,文章提出了基于用户兴趣的结果合成算法。它根据用户兴趣对结果进行相似度计算和结果去重,从而为用户提供贴切的查询结果。实验表明,该算法提高了用户的检索效率和质量。
徐科崔志明郑冬冬
关键词:个性化元搜索引擎用户兴趣
Deep Web爬虫研究与设计
随着Web的发展,越来越多的数据可以通过表单提交来获取,这些表单提交所产生信息是由Deep Web后台数据库动态产生的.在这种情况下,信息集成就更加需要Web爬虫来自动获取这些页面以进一步地处理数据.为了帮助用户完成这样...
郑冬冬赵朋朋崔志明
关键词:爬虫数据库信息集成
文献传递
Deep Web爬虫爬行策略研究被引量:28
2006年
如今Web上越来越多的信息可以通过查询接口来获得,为了获取某DeepWeb站点的页面用户不得不键入一系列的关键词集。由于没有直接指向DeepWeb页面的静态链接,当前大多搜索引擎不能发现和索引这些页面。然而,近来研究表明DeepWeb站点提供的高质量的信息对许多用户来说是非常有价值。这里研究了怎样建立起一个有效的DeepWeb爬虫,它可以自动发现和下载DeepWeb页面。由于DeepWeb惟一“入口点”是查询接口,DeepWeb爬虫设计面对的主要挑战是怎样对查询接口自动产生有意义的查询。这里提出一种针对查询接口查询自动产生问题的理论框架。通过在实际DeepWeb站点上的实验证明了此方法是非常有效的。
郑冬冬崔志明
关键词:DEEPWEBDEEPWEB爬虫
Deep Web爬虫研究与设计被引量:54
2005年
随着W eb的发展,越来越多的数据可以通过表单提交来获取,这些表单提交所产生信息是由D eep W eb后台数据库动态产生的。在这种情况下,信息集成就更加需要W eb爬虫来自动获取这些页面以进一步地处理数据。为了帮助用户完成这样的任务,提出一种用于搜集D eep W eb页面的爬虫的设计方法。此方法使用一个预定义的领域本体知识库来识别这些页面的内容,同时利用一些来自W eb站点的导航模式来识别自动填写表单时所需进行的路径导航。通过对来自不同领域的D eep W eb站点的大量实验,验证了此方法是非常有效的。
郑冬冬赵朋朋崔志明
关键词:DEEPWEB爬虫
DeepWeb信息集成系统关键技术研究
随着Internet信息的迅速增长,整个Web信息已经被各种各样的可搜索的在线数据库所“深化”,那些信息被隐藏在Web查询接口下面。为了集成这些“Deep Web”信息,本文建立了一个Deep Web信息集成系统来方便用...
郑冬冬
关键词:查询转换
文献传递
共1页<1>
聚类工具0