您的位置: 专家智库 > >

周怡

作品数:2 被引量:19H指数:1
供职机构:武汉大学信息管理学院更多>>
发文基金:教育部人文社会科学重点研究基地度重大研究项目国家自然科学基金更多>>
相关领域:文化科学更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇文化科学

主题

  • 1篇语义
  • 1篇语义聚类
  • 1篇聚类
  • 1篇关键词
  • 1篇关键词抽取
  • 1篇抽取
  • 1篇抽取方法

机构

  • 1篇武汉大学

作者

  • 1篇李旭晖
  • 1篇周怡
  • 1篇李旭晖

传媒

  • 1篇情报科学

年份

  • 1篇2022
2 条 记 录,以下是 1-1
排序方式:
基于语义聚类的关键词抽取方法被引量:1
2022年
【目的/意义】关键词抽取的本质是找到能够表达文档核心语义信息的关键词汇,因此使用语义代替词语进行分析更加符合实际需求。本文基于TextRank词图模型,利用语义代替词语进行分析,提出了一种基于语义聚类的关键词抽取方法。【方法/过程】首先,将融合知网(HowNet)义原信息训练的词向量聚类,把词义相近的词语聚集在一起,为各个词语获取相应的语义类别。然后,将词语所属语义类别的窗口共现频率作为词语间的转移概率计算节点得分。最后,将TF-IDF值与节点得分进行加权求和,对关键词抽取结果进行修正。【结果/结论】从整体的关键词抽取结果看,本文提出的关键词抽取方法在抽取效果上有一定提升,相比于TextRank算法在准确率P,召回率R以及F值上分别提升了12.66%、13.77%、13.16%。【创新/局限】本文的创新性在于使用语义代替词语,从语义层面对相关性网络进行分析。同时,首次引入融合知网义原信息的词向量用于关键词抽取工作。局限性在于抽取方法依赖知网信息,只适用于中文文本抽取。
李旭晖李旭晖
关键词:关键词抽取语义聚类
共1页<1>
聚类工具0