您的位置: 专家智库 > >

刘俊延

作品数:1 被引量:5H指数:1
供职机构:广东外语外贸大学思科信息学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇热词
  • 1篇网络
  • 1篇网络热点
  • 1篇聚类
  • 1篇复合词
  • 1篇抽取
  • 1篇词聚类

机构

  • 1篇广东外语外贸...

作者

  • 1篇李霞
  • 1篇王连喜
  • 1篇路美秀
  • 1篇刘俊延
  • 1篇刘汉锋

传媒

  • 1篇图书情报工作

年份

  • 1篇2016
1 条 记 录,以下是 1-1
排序方式:
基于复合词生成的网络热点话题识别及描述算法被引量:5
2016年
[目的/意义]在海量网络新闻和微博等新媒体文本中自动识别网络热点话题并抽取有意义词串来描述热点事件,对自动识别和描述网络舆情具有重要的研究意义。[方法/过程]在现有热点描述词抽取方法中,利用关联规则或多元词组合方法在抽取过程中存在噪音词较多和特征词语义被放大或转移等问题。本文提出一种基于复合词生成的描述词抽取方法,在所提取的语义更为精确的描述词集合上使用一趟聚类算法对新闻文本进行聚类,自动识别网络热点话题并对热点话题进行排名。[结果/结论]对腾讯新闻事件文本数据集所做的实验结果表明,本文所提出的方法较传统的词特征抽取方法在聚类结果上具有更好的话题簇识别能力和簇描述能力。
李霞王连喜路美秀刘汉锋刘俊延
共1页<1>
聚类工具0