您的位置: 专家智库 > >

郎君

作品数:20 被引量:100H指数:5
供职机构:新加坡信息技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划黑龙江省科技攻关计划更多>>
相关领域:自动化与计算机技术语言文字自然科学总论一般工业技术更多>>

文献类型

  • 9篇期刊文章
  • 9篇会议论文
  • 1篇学位论文
  • 1篇专利

领域

  • 16篇自动化与计算...
  • 3篇语言文字
  • 1篇机械工程
  • 1篇一般工业技术
  • 1篇自然科学总论

主题

  • 5篇语言处理
  • 5篇中文
  • 5篇自然语言
  • 5篇自然语言处理
  • 4篇信息检索
  • 4篇共指消解
  • 3篇代词
  • 3篇代词消解
  • 3篇网络
  • 3篇句法
  • 3篇贝叶斯
  • 3篇XML
  • 3篇LTP
  • 3篇词义
  • 2篇信息处理
  • 2篇性别识别
  • 2篇语言学
  • 2篇支持向量
  • 2篇支持向量机
  • 2篇指代消解

机构

  • 19篇哈尔滨工业大...
  • 1篇新加坡信息技...

作者

  • 20篇郎君
  • 16篇刘挺
  • 12篇秦兵
  • 10篇李生
  • 3篇张会鹏
  • 2篇宋巍
  • 2篇忻舟
  • 2篇宋巍
  • 1篇卢志茂
  • 1篇于海滨
  • 1篇周秀杰
  • 1篇张牧宇
  • 1篇苏小红
  • 1篇黎耀炳
  • 1篇李正华
  • 1篇刘龙

传媒

  • 3篇中文信息学报
  • 2篇第三届学术计...
  • 1篇哈尔滨工业大...
  • 1篇自动化学报
  • 1篇计算机学报
  • 1篇计算机应用研...
  • 1篇高技术通讯
  • 1篇智能计算机与...
  • 1篇第四届全国学...
  • 1篇第三届学生计...
  • 1篇第四届全国学...

年份

  • 1篇2011
  • 1篇2010
  • 3篇2009
  • 6篇2008
  • 6篇2006
  • 3篇2004
20 条 记 录,以下是 1-10
排序方式:
基于统计方法的共指消解技术研究
自然语言中共指现象非常普遍。一个真实世界中的实体在自然语言中出现的时候,往往会有多种多样的表达。虽然人们可以毫无困难的区分文章中同一实体的不同体现,但对计算机而言仍是非常困难的。共指消解就是根据文档中各个表述的自身内容以...
郎君
关键词:自然语言处理共指消解
文献传递
集成多种背景语义知识的共指消解被引量:7
2009年
共指消解是信息抽取中一个重要子任务。近年来,许多学者尝试利用统计机器学习的方法来进行共指消解并取得了一定的进展。背景知识作为新的研究热点已经被越来越多地利用在自然语言处理的各个领域。该文集成多种背景语义知识作为基于二元分类的共指消解框架的特征,分别在WordNet、维基百科上提取背景知识,同时利用句子中的浅层语义关系、常见文本模式以及待消解词上下文文本特征。并利用特征选择算法自动选择最优的特征组合,同时对比同样的特征下最大熵模型与支持向量机模型的表现。在ACE数据集上实验结果表明,通过集成各种经过特征选择后的背景语义知识,共指消解的结果有进一步提高。
郎君忻舟秦兵刘挺李生
关键词:计算机应用中文信息处理共指消解WORDNET维基百科
中文人称名词短语单复数自动识别被引量:5
2008年
名词短语的单复数信息在共指消解中是必不可少的特征.与英语不同,中文属于汉藏语系,名词本身不能明显体现单复数信息,需要借助其所在的名词短语来进行体现.本文在自动内容抽取(Automatic content extraction,ACE)语料上抽取得到人称名词短语的单复数信息,分别采用了基于规则和机器学习的方法来进行人称名词短语的单复数自动识别,基于规则的方法,在一些知识资源的基础上定义了规则模板库,每条规则采用槽和槽值的方法米进行体现;机器学习方法采用最大熵模型组合考察了词形、词性、词义、数量关系等特征.两种方法分别达到了48.24%和87.48%的正确率.实验结果显示,基于规则的方法能够保证精确率而不能保证召回率,机器学习的方法可以更好地完成单复数信息的识别任务.
郎君秦兵刘挺李正华李生
关键词:单复数
一种基于实例动态泛化的共指消解方法
一种基于实例的动态泛化共指消解方法,涉及文本信息抽取领域。本发明所述动态泛化共指消解方法由训练实例库构建阶段和篇章内实体消解阶段组成,并经由实例构建、实例库构建、建立索引、动态泛化与实例检索以及共指链合成几部分完成共指消...
秦兵刘挺郎君黎耀炳张牧宇
文献传递
神经网络和贝叶斯网络在汉语词义消歧上的对比研究被引量:11
2004年
神经网络和贝叶斯网络是两种经典的机器学习方法。本文通过实验考察了这两种网络模型在汉语词义消歧上的应用效果。实验对象是通过特定规则构造的6个伪词。使用伪词可以避免有指导的词义消歧方法中的数据稀疏问题,充分验证词义分类器的实验效果。贝叶斯网络用于词义分类简单高效,模型容易构造,而神经网络的结构则相对复杂,用于词义消歧需要先解决输入问题。实验中采用词间互信息成功构造了神经网络的输入模型,实验效果较为理想。实验数据表明贝叶斯网络比神经网络更适合解决汉语词义消歧问题。但贝叶斯网络的抗噪声能力却明显逊色于神经网络。
卢志茂刘挺郎君李生
关键词:神经网络贝叶斯网络汉语互信息词义消歧
统计机器翻译中翻译模型的约简概述被引量:1
2011年
统计机器翻译从诞生至今获得了长足的发展,目前已经成为机器翻译的主流。但是作为基础模块之一的翻译模型却随训练语料的增大而呈现飞速增大的趋势。为了使统计机器翻译更加实用,翻译模型的约简一直是研究热点之一。概述了统计机器翻译中翻译模型约简的研究现状,相关方法主要围绕解码过程统计分析、训练语料中的统计分析、翻译模型中的短语对自身特点分析等三个类别。结合相关分析,最后也探讨了这个方向的未来发展趋势。
郎君
关键词:统计机器翻译FISHER精确检验
命名实体识别和指代消解在文摘系统中的应用被引量:11
2006年
介绍了一个基于句子抽取的单文档自动文摘系统,在该系统基础上应用了命名实体识别和指代消解技术,最后通过人工评价和自动评价结果讨论命名实体识别和指代消解对文摘系统的贡献。
于海滨秦兵刘挺郎君
关键词:自动文摘命名实体识别指代消解
句法与词义相结合的中文代词消解
句法知识对代词消解有着很大的支持。近年来依存句法由于其利于描述语言中词与词之间的关系、突出核心词的特点日益得到重视。本文提出了一种中文第三人称代词消解方法,直接利用依存句法分析器的结果,构建有效的句法角色特征和名词短语的...
宋巍秦兵郎君刘挺
关键词:代词消解支持向量机
文献传递
句法与词义相结合的中文代词消解被引量:4
2008年
句法知识对代词消解有很大的帮助。近年来依存句法由于其利于描述语言中词与词之间的关系、突出核心词的特点日益得到重视。该文提出了一种中文第三人称代词消解方法,直接利用依存句法分析器的结果,构建有效的句法角色特征和名词短语的支配词之间的词义相似和词语相关特征,采用支持向量机作为分类器,在ACE2005语料上的实验证明了这些特征的有效性。
宋巍秦兵郎君刘挺
关键词:计算机应用中文信息处理代词消解
基于XML的开放式语言技术平台:LTP
本文描述了一套面向Web基于XML的开放式中文语言处理平台,命名为“语言技术平台 LTP”。LTP包含5项主要内容:语言技术置标语言LTML、基于DOM Tree的一套DLL模块、一套可视化工具、基于LTML的语料库资源...
郎君刘挺李生张会鹏
关键词:自然语言处理信息检索XML
文献传递
共2页<12>
聚类工具0