您的位置: 专家智库 > >

文献类型

  • 6篇中文专利

主题

  • 2篇队列
  • 2篇新闻
  • 2篇新闻采集
  • 2篇信息采集
  • 2篇信息类型
  • 2篇页面
  • 2篇用户
  • 2篇用户生成内容
  • 2篇数据集
  • 2篇数据集中
  • 2篇数据项
  • 2篇转发
  • 2篇文本
  • 2篇面向用户
  • 2篇基础信息
  • 2篇关键词
  • 2篇分布式
  • 2篇分布式采集
  • 2篇分词
  • 2篇词语

机构

  • 6篇中国科学院

作者

  • 6篇李锦涛
  • 6篇吴波
  • 6篇曹娟
  • 6篇张勇东
  • 2篇郭俊波

年份

  • 2篇2018
  • 1篇2016
  • 2篇2015
  • 1篇2013
6 条 记 录,以下是 1-6
排序方式:
一种面向用户生成内容的分布式采集方法与系统
本发明提供一种面向用户生成内容的分布式采集方法,包括:1)根据采集页面的采集量和采集难度划分页面类型,基于页面类型构建采集任务并将其加入采集队列;其中,所述采集任务包括复合采集任务,所述复合采集任务根据采集量和采集难度将...
张勇东吴波曹娟郭俊波李锦涛
文献传递
基于微博内容的关键词挖掘方法及系统
本发明提供一种基于微博内容的关键词挖掘方法,对于所有微博文本经分词得到的所有词的集合中的每个词,基于该词在每个微博文本中出现的次数及该微博文本被转发的次数来计算该词的权重;并选取其权重大于预定阈值的词作为从该微博数据集中...
高宝强吴波曹娟张勇东李锦涛
文献传递
一种微博信息采集方法及系统
本发明提供一种微博信息采集方法及系统,所述方法包括:根据用户提交的查询确定信息类型以及页面链接参数;向微博服务器发送根据所述信息类型和所述页面链接参数构造的页面请求链接,抽取返回页面中的基础信息数据项。所述方法还包括:并...
吴波曹娟张勇东李锦涛
文献传递
一种面向用户生成内容的分布式采集方法与系统
本发明提供一种面向用户生成内容的分布式采集方法,包括:1)根据采集页面的采集量和采集难度划分页面类型,基于页面类型构建采集任务并将其加入采集队列;其中,所述采集任务包括复合采集任务,所述复合采集任务根据采集量和采集难度将...
张勇东吴波曹娟郭俊波李锦涛
文献传递
基于微博内容的关键词挖掘方法及系统
本发明提供一种基于微博内容的关键词挖掘方法,对于所有微博文本经分词得到的所有词的集合中的每个词,基于该词在每个微博文本中出现的次数及该微博文本被转发的次数来计算该词的权重;并选取其权重大于预定阈值的词作为从该微博数据集中...
高宝强吴波曹娟张勇东李锦涛
文献传递
一种微博信息采集方法及系统
本发明提供一种微博信息采集方法及系统,所述方法包括:根据用户提交的查询确定信息类型以及页面链接参数;向微博服务器发送根据所述信息类型和所述页面链接参数构造的页面请求链接,抽取返回页面中的基础信息数据项。所述方法还包括:并...
吴波曹娟张勇东李锦涛
文献传递
共1页<1>
聚类工具0