您的位置: 专家智库 > >

国家自然科学基金(6057378)

作品数:1 被引量:2H指数:1
相关作者:朱婷陆浩曾大军滕桂法更多>>
相关机构:河北农业大学中国科学院自动化研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:理学交通运输工程一般工业技术自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...
  • 1篇交通运输工程
  • 1篇一般工业技术
  • 1篇理学

主题

  • 1篇农业
  • 1篇农业领域
  • 1篇爬虫
  • 1篇自适
  • 1篇自适应
  • 1篇聚焦爬虫

机构

  • 1篇河北农业大学
  • 1篇中国科学院自...

作者

  • 1篇滕桂法
  • 1篇曾大军
  • 1篇陆浩
  • 1篇朱婷

传媒

  • 1篇计算机应用与...

年份

  • 1篇2009
1 条 记 录,以下是 1-1
排序方式:
基于在线增量学习的自适应聚焦爬虫研究被引量:2
2009年
在原始分类器聚焦爬虫的基础上设计并实现在线增量学习的自适应聚焦爬虫。该聚焦爬虫包括一个基础网页分类器和一个在线增量学习自适应链接分类器。基础页面分类器根据领域知识对抓取到的页面内容主题相关性进行分类。在线增量学习自适应链接分类器能即时根据爬虫爬得网页和网页链接信息作出分类模型调整以更合理方式计算链接的主题相关度。系统中链接排序模块采用TopicalRank主题相关度计算方法分析链接优先抓取顺序。把基于增量学习的自适应聚焦爬虫应用到农业领域,实验结果和分析证明在线增量学习的自适应聚焦爬虫在农业领域爬行性能比仅基于网页相关性和链接重要度的原始分类器聚焦爬虫具有更好的性能。
朱婷滕桂法陆浩张长利曾大军
关键词:聚焦爬虫农业领域
共1页<1>
聚类工具0