您的位置: 专家智库 > >

郭晟

作品数:2 被引量:15H指数:1
供职机构:武汉大学计算机学院更多>>
发文基金:国家自然科学基金国家社会科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇主题
  • 2篇主题模型
  • 1篇语言处理
  • 1篇社会媒体
  • 1篇社交
  • 1篇社交网
  • 1篇社交网络
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇网络
  • 1篇媒体
  • 1篇GPU

机构

  • 2篇武汉大学
  • 1篇乐山师范学院

作者

  • 2篇孙锐
  • 2篇姬东鸿
  • 2篇郭晟

传媒

  • 1篇计算机学报
  • 1篇计算机应用研...

年份

  • 2篇2017
2 条 记 录,以下是 1-2
排序方式:
融入事件知识的主题表示方法被引量:15
2017年
主题模型已被广泛用于发现文档潜在主题.已有方法多采用词或短语来表示主题,然而这些方法生成的主题缺乏深层次的语义信息,可解释性比较差.文中提出使用结构化的事件来表示主题.一方面,事件包含比词或短语更丰富的语义;另一方面,一组相关的事件能更合理地解释并区分不同的主题.为解决事件作为基本单元所带来的稀疏性问题,该文在Biterm Topic Model(BTM)的基础上提出两种主题模型,采用两种不同的方式将事件的语义知识融入到主题生成过程中.其中,第1种模型利用Generalized Pólya Urn(GPU)模型天然的聚类效果加大语义相近的事件分配到同一主题的概率,而第2种模型则通过为每个biterm引入指示变量,合理地利用语义知识有效地解决同一个biterm中两个事件的主题分配问题.该文不仅从主题凝聚度和KL散度两个指标直接对主题模型进行评估,还通过将主题表示结果引入到文本分类任务中对模型进行了外部评估.实验结果表明文中提出的模型从共现和语义两个层面有效地解决了事件稀疏性问题.与基于词或短语的主题表示相比,事件结构所包含的语义信息提高了主题生成质量,使主题表示具有更强的可读性和主题判别性.
孙锐郭晟姬东鸿
关键词:主题模型自然语言处理社交网络社会媒体
基于结构化事件的主题表示
2017年
基于词袋的主题模型其最终主题表示存在着表意不清、可读性差等问题,为解决此问题,提出将事件作为文档和主题描述的基本元素进行主题建模。鉴于事件的稀疏性,采用基于Biterm的主题模型,并在主题推断时结合generalized Pólya urn(GPU)模型加入事件间关联性的先验知识进行指导监督,从共现和语义两个层面削弱了事件稀疏性对主题生成的负作用。实验结果表明,该算法得到的主题可解释性较好且聚类效果提升明显。
郭晟孙锐姬东鸿
关键词:主题模型
共1页<1>
聚类工具0