您的位置: 专家智库 > >

李学凯

作品数:2 被引量:4H指数:1
供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
发文基金:国家教育部博士点基金国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自然科学总论自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 1篇自动化与计算...
  • 1篇自然科学总论

主题

  • 2篇引擎
  • 2篇搜索
  • 2篇搜索引擎
  • 2篇索引
  • 1篇多任务
  • 1篇多通道
  • 1篇一致性
  • 1篇站点
  • 1篇爬虫
  • 1篇WEB站
  • 1篇WEB站点
  • 1篇HASH算法
  • 1篇垂直搜索
  • 1篇垂直搜索引擎

机构

  • 2篇哈尔滨工业大...

作者

  • 2篇李学凯
  • 1篇李斌
  • 1篇许笑
  • 1篇张伟哲
  • 1篇孙春奇

传媒

  • 1篇计算机工程

年份

  • 1篇2010
  • 1篇2009
2 条 记 录,以下是 1-2
排序方式:
面向垂直搜索引擎的Web站点划分方案被引量:4
2010年
分析传统搜索引擎分配任务的方式及存在的问题,根据垂直搜索引擎的特点,提出一种比传统方法粒度更细的任务分配方式——网站划分。该分配方式将较大规模的网站切分为若干较小规模的子集,并将子集交给若干爬虫节点并行抓取,以加快爬虫系统的整体获取速率,作为对传统方法的有效优化。将网站划分算法应用于样本数据集,验证其有效性。
李学凯许笑孙春奇张伟哲李斌
关键词:垂直搜索引擎爬虫
面向多任务、多通道并行爬虫的技术研究
不同于传统的搜索引擎只有一个全局大任务,该系统需要处理不同用户下发的多种任务。每个用户只关心某几个网站,而且实时性要求比较高,在特定的时间内,需要对目标网站进行频繁抓取。该系统研究的是具有多任务管理和分配的并行爬虫,任务...
李学凯
关键词:搜索引擎
文献传递
共1页<1>
聚类工具0