吴云芳
- 作品数:50 被引量:334H指数:13
- 供职机构:北京大学更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 动词性并列结构的结构平行被引量:5
- 2004年
- 本文讨论了动词性并列结构的结构平行特征:状中结构的不平行,述宾结构的平行,主谓结构的平行,音节数目的相同。可用一个复杂特征结构来描述动词短语,包括两个属性特征“结构和音节”,其中“结构”又有两个取值“述宾和主谓”。对两个动词短语,只要其中的一个属性特征相同(结构或者音节)就可形成并列。动词性并列结构表现出来的平行性可以帮助计算机自动识别并列结构的边界。
- 吴云芳
- 关键词:现代汉语动词短语状中结构
- HPSG理论简介被引量:11
- 2003年
- 本文概要介绍了HPSG理论(中心语驱动短语结构语法)。表层导向、基于约束和词汇主义是HPSG的主要理论主张;特征结构是HPSG描述语法信息的主要手段,词汇类体系结构和词汇规则构成了HPSG的词汇体系;中心语——补足语规则、中心语——指定语规则等以及中心语特征原则、值传递原则等构成了HPSG的规则系统。文章最后对HPSG和GB理论进行了简要的比较。
- 吴云芳
- 关键词:句法理论计算语言学特征结构词汇
- 汉英双语短语信息数据库的构建
- 本文扼要介绍了一个汉英双语短语信息数据库的构建情况:汉语短语的描述信息;英语短语的描述信息:描述中的疑难问题;短语库的实施和应用。短语库是综合型语言知识库的有机组成部分,它的建设将为短语结构研究、句法分析和机器翻译提供强...
- 吴云芳常宝宝詹卫东
- 关键词:短语结构机器翻译
- 文献传递
- 动词对宾语的语义选择限制被引量:31
- 2005年
- 动词对论元的语义选择限制一直是自然语言处理研究领域一个备受关注的问题。本文选取现代汉语中4 6个高频的、可以带体词性宾语的动词,借助知网的名词语义分类体系,基于《人民日报》语料,考察了动词对宾语的语义选择限制,归纳成5种类型,在此基础上讨论了语义选择限制在汉语信息处理中的应用和局限,并进而讨论了上下位语义关系、部分整体语义关系在动词语义选择限制中的作用。
- 吴云芳段慧明俞士汶
- 关键词:语义关系词义消歧
- 汉语词义自动标注研究软件平台的设计与实现
- 词语义项标注在自然语言处理领域占有重要地位.词义排歧知识的获取、基于排歧知识构建词义标注的语言模型,以及对所构建模型性能的评价就成为词语义项标注系统的三个核心问题,尤其是前两个问题非常重要,难度也很大.为更好地研究这些问...
- 张仰森俞士汶段惠明吴云芳
- 关键词:知识获取
- 文献传递
- “和”“与”“并”“而”连接谓词性成分时的区别被引量:15
- 2005年
- 并列连词“和”“与”“并”都可以连接动词性成分 ,“和”“与”“而”都可以连接形容词性成分 ,但它们在句法位置的分布上显现出差异 ,这种差异可以从“表述功能”得到合理的解释 :“和”“与”连接的并列结构是指称性的 ,“并”“而”连接的并列结构是陈述性的。
- 吴云芳
- “是”字句主语和宾语的自动界定被引量:3
- 2002年
- “是”字句是现代汉语中比较特殊的、又是比较常见的一种句子形式 ,对其主语部分和宾语部分的自动界定和标注将有助于机器翻译、信息检索、信息提取等的研究。本文通过考察语料中“是”字句的句法表现 ,总结、提取了“是”字句的自动标注规则 ,对《人民日报》一个月语料中的“是”字句进行了自动标注。实验结果表明 ,对没有逗号的句子 ,标注正确率可达到 99%以上 ;对有逗号的句子 ,标注正确率为 89%。
- 吴云芳段慧明俞士汶
- 关键词:字句浅层分析主语宾语自然语言处理
- 汉语篇章级小句关系的标注体系被引量:3
- 2015年
- 句际关系自动分析属于篇章语义学研究的范畴,虽然英语句际关系的研究已有大量工作,但汉语句际关系的自动分析还只是刚刚起步。该文在RST理论框架下,结合汉语特点,提出了完整的汉语篇章级小句关系标注体系。将汉语话题和逻辑关系置于同一个框架下进行描述,将小句关系划分为事件附属关系和事件逻辑关系两大类。逻辑关系又包括6个中类、15个小类。目前已在人民日报语料上完成了8 000个句子的小句关系标注。抽取出其中1 000个句子检测了双盲标注的一致性,揭示了汉语意合性语言小句关系标注的困难;并基于标注数据对关系类型进行了定量分析,指示了汉语句际关系自动分析将面临的重点和难点。
- 吴云芳徐艺峰王恺然
- 关键词:句际关系小句关系语料库标注
- 汉语词义自动标注研究软件平台的设计与实现
- 词语义项标注在自然语言处理领域占有重要地位。词义排歧知识的获取、基于排歧知识构建词义标注的语言模型,以及对所构建模型性能的评价就成为词语义项标注系统的三个核心问题,尤其是前两个问题非常重要,难度也很大。为更好地研究这些问...
- 张仰森俞士汶段惠明吴云芳
- 关键词:知识获取
- 文献传递
- 词语多义的表征
- 词义自动消歧长时期以来一直是自然语言处理中的热点难题。词语多义的表征主要有下面四种形式:(1)意义训释,(2)语义原语,(3)语义关系,(4)框架网络。人和计算机都是借助词语出现的上下文语境来消解词语歧义的,而上述四种语...
- 吴云芳刘扬俞士汶
- 关键词:多义词词义消歧自然语言处理
- 文献传递