您的位置: 专家智库 > >

魏彦婧

作品数:1 被引量:2H指数:1
供职机构:东北大学更多>>
发文基金:中央高校基本科研业务费专项资金辽宁省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇新闻
  • 1篇新闻网
  • 1篇页面
  • 1篇爬虫
  • 1篇主题提取
  • 1篇网络
  • 1篇网络爬虫
  • 1篇相关度

机构

  • 1篇东北大学

作者

  • 1篇翟莹莹
  • 1篇吕振辽
  • 1篇魏彦婧

传媒

  • 1篇控制工程

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
面向新闻网的智能抓取技术被引量:2
2013年
随着新闻网信息的急剧增加,研究面向新闻网的智能抓取技术变得十分必要。在基于主题网络爬虫的基础上,改进了网页与主题的相关度算法,设计出面向新闻网的智能抓取技术。按照预先确定的主题,分析超链接和刚刚抓取的网页内容,获取下一个要爬行的URL。有选择的访问新闻网上的网页和相关的链接,尽可能保证多爬行与主题相关的网页。实验结果表明,改进后的抓取技术比以往的新闻网抓取技术在性能上有较大提升,抓取准确率显著提高。
吕振辽翟莹莹魏彦婧
关键词:主题提取网络爬虫
共1页<1>
聚类工具0