高俊伟
- 作品数:4 被引量:8H指数:1
- 供职机构:苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于SVM的中文名词短语指代消解研究被引量:5
- 2012年
- 指代消解是自然语言处理领域中要研究的关键问题之一。在自然语言中,为了使语言简明,减少冗余,往往对同一意思的单词、句子或某一事件用不同的单词来代替。相对于人而言,计算机理解这些指代现象就比较困难,因此近年来关于指代消解的研究越来越多。由于中文指代消解研究起步较晚,因此关于中文名词短语指代消解的研究还比较少,大多研究是关于英文指代消解的。给出了一个基于SVM的中文名词短语指代消解平台并详细介绍了整个实现过程,语料库采用OntoNotes 3.0的中文新闻语料。利用3种评测算法对系统性能进行了评测,结果表明本系统是一个比较好的中文指代消解平台。
- 高俊伟孔芳朱巧明李培峰
- 关键词:指代消解名词短语自然语言处理SVM
- 中文指代消解关键问题研究
- 在自然语言中,人们为了避免重复,习惯用代词、称谓和缩略语来指代前面提到的实体全称,这就是指代现象。指代消解是自然语言处理的一个重要分支,其解决的主要问题是找出出现在文本中的指代现象。
本文主要研究中文指代消解的相...
- 高俊伟
- 关键词:指代消解名词短语语料
- 文献传递
- 语料对中文名词短语指代消解影响研究被引量:1
- 2013年
- 指代是自然语言中一种常见的语言现象,对简化语言,减少冗余有很大的作用。指代消解是用计算机找出这些指代现象的一个过程。近几年英文指代消解研究取得了很大的成就,然而,中文指代消解研究目前还较少,一方面是由于中文自然语言处理的研究起步较晚,相关的知识较少,另外一方面就是中文相关的语料库较少,目前已知的仅有ACE2005,OntoNotes等。为了探讨语料库对中文名词短语指代消解的影响,该文实现了一个基于有监督学习方法的中文名词短语指代消解平台和一个基于无监督聚类方法的中文名词短语指代消解平台,在此平台的基础上从语料库的数量和质量两个方面来探讨语料对中文名词短语指代消解的影响。
- 高俊伟孔芳朱巧明李培峰
- 关键词:指代消解名词短语聚类语料
- 无监督中文名词短语指代消解研究被引量:1
- 2012年
- 为减小语料库对中文指代消解的影响,设计一个基于无监督聚类的中文名词短语指代消解平台并给出其预处理、特征选择及聚类过程。采用3种评测工具对中文新闻语料进行评测,在自动情况下,平均F值为59.43%。实验结果表明,该中文指代消解平台能够较好地解决中文缺少语料库的问题。
- 高俊伟孔芳朱巧明李培峰华秀丽
- 关键词:名词短语指代消解聚类自然语言语料