您的位置: 专家智库 > >

王鑫

作品数:4 被引量:7H指数:2
供职机构:武汉大学信息管理学院更多>>
发文基金:国家自然科学基金国家社会科学基金中国博士后科学基金更多>>
相关领域:文化科学更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇文化科学

主题

  • 1篇一致性
  • 1篇引文
  • 1篇上下文
  • 1篇替代性
  • 1篇歧义性
  • 1篇注意力
  • 1篇网络
  • 1篇文本分类
  • 1篇计算机
  • 1篇计算机领域
  • 1篇查询

机构

  • 3篇武汉大学
  • 1篇西南大学

作者

  • 3篇王鑫
  • 2篇王鑫
  • 2篇程齐凯
  • 1篇桂思思
  • 1篇陆伟
  • 1篇张晓娟
  • 1篇李信

传媒

  • 1篇数字图书馆论...
  • 1篇情报工程
  • 1篇数据分析与知...

年份

  • 1篇2020
  • 1篇2019
  • 1篇2017
4 条 记 录,以下是 1-3
排序方式:
基于层次注意力网络的论证区间识别研究被引量:1
2020年
学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的HAN深度学习模型对学术文本论证区间识别进行了研究。本文首先构建了一个基于层次注意力机制的论证区间识别模型,阐述了该模型的整体架构和作用机制。其次,针对生物医学领域提出了一个论证区间9分类体系,在PubMed生物医学数据集上,用LSTM和SVM两种文本分类算法与HAN模型进行对比实验。研究结果表明,本文所采用的HAN模型在各个类别的论证区间识别上效果均为最优,F1值达到了0.90,能够较好的完成论证区间识别研究。最后,对实验结果进行错误总结和分析,并指出了下一步的研究方向。
王鑫王鑫程齐凯罗卓然
关键词:文本分类
基于引文上下文的相关研究辅助生成系统设计与实现被引量:2
2017年
本文对学术文本引文上下文的定义及其识别研究进展进行梳理,考虑科研人员在相关研究撰写过程中或期刊编辑在审稿过程中的特定信息需求,探讨基于引文上下文辅助生成相关研究章节的可行性。在此基础上,对基于引文上下文的相关研究辅助生成系统的系统思路、功能模块进行设计,并以Science Direct数据库在1957—2014年收录的289 926篇计算机领域的科研文献全文网页数据作为数据源,实现相关研究辅助生成系统RWGS。结果表明,RWGS可较好满足科研人员在撰写相关研究章节或期刊编辑在审稿时更细粒度的信息需求,对传统学术数据库的检索结果有一定优化效果,同时将文献检索、文献阅读和相关研究写作三个过程有机地整合,有效改善系统用户体验,提升学术创作效率。
王鑫程齐凯李信陆伟
关键词:计算机领域
查询歧义性程度自动标注指标的替代性验证研究被引量:3
2019年
【目的】针对查询歧义性程度的标注问题,通过分析自动标注指标间的相关性及自动标注指标与人工标注指标的一致性,以期获得在一定程度上能替代其他自动标注指标和人工标注的自动标注指标。【方法】分别选取基于文档、用户以及查询词项特征的自动标注指标,依据查询词项对应类目的频率改进一种基于查询词项特征的自动标注指标;利用皮尔逊相关系数与对称AP相关系数分析自动标注结果之间的相关性,利用宏平均F1与宏平均准确率分析自动标注指标与人工标注结果的一致性。【结果】自动标注指标之间相关性较弱;本文改进的自动标注指标与人工标注指标之间一致性最高:宏平均F1值与宏平均准确率分别为0.623与0.707。【局限】限于目录型网站的查询词项覆盖率,部分自动标注指标无法用于所有歧义性查询,导致用于检验替代性的歧义查询数量较少。【结论】自动标注指标之间的替代性较弱;查询词项对应类目的频率能提高基于查询词项特征的自动标注指标间一致性;与已有自动标注指标相比,本文改进的自动标注指标与人工标注结果一致性最高,在一定程度上可替代人工标注。
桂思思张晓娟张晓娟
关键词:替代性一致性
共1页<1>
聚类工具0