吕晨
- 作品数:10 被引量:20H指数:3
- 供职机构:武汉大学计算机学院更多>>
- 发文基金:国家自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 基于特征结构的汉语主谓谓语句语义标注研究被引量:8
- 2012年
- 建构大规模的汉语语义资源,是当前中文信息处理的重要任务之一。但是其中语义分析的传统方法存在一些问题,不能很好的反映汉语中各个词语或成分之间的语义关联。该文提出了基于特征结构的语义标注方法,并在此基础上建构了一个大规模的汉语语义资源。以汉语主谓谓语句为例,探讨了特征结构的标注方法。结果表明,特征结构分析解决了以往传统标注方法对汉语特殊句型无法表示的难题,包含更多的语义信息,其标注效率更高,标注精度也更高。
- 陈波姬东鸿吕晨
- 关键词:特征结构主谓谓语句语义标注
- 基于扩展依存语法模型的汉语动补结构语义标注研究
- 汉语的动补结构中主、宾、动、补四个成分之间的语义关系错综复杂,自然语言处理很难对动补结构的语义关系进行完整的形式化描述。本文提出了一个新颖的扩展依存语法模型,运用特征结构的方法形式化地描述动补结构中的主、宾、动、补四个成...
- 陈波吕晨魏晓梅杨华姬东鸿
- 关键词:中文信息处理动补结构特征结构
- 文献传递
- 基于受限的语义依存分析的文本推理方法
- 本发明公开了一种基于受限的语义依存分析的文本推理方法,包括以下步骤:步骤一、根据语义依存的表示机制,建立一个汉语文本推理标注资源,其中,一个文本推理标注实例包含一个语段T、一个假设H、假设H的语义依存图及推理类型;步骤二...
- 姬东鸿吕晨滕冲张明尧孙程陈波汪辉史华新韩欣吴龙飞
- 文献传递
- 基于特征结构的汉语连动句语义标注研究被引量:8
- 2013年
- 对汉语特殊句型的语义分析是当前中文信息处理的难点之一。现有的传统语义分析方法存在一些问题,不能很好的反映汉语中各个词语或成分之间的语义关联。该文以汉语连动句为例,提出了基于特征结构模型的语义标注方法,探讨了连动句的语义标注模型,并在此基础上建构了一个大规模的汉语语义资源。结果表明,特征结构模型能够对连动句中的主语与多个谓语动词、多个宾语之间的复杂语义关系进行全面准确的描述,为面向汉语的自然语言处理提供了一种不同的语义分析方法。
- 陈波姬东鸿吕晨
- 关键词:特征结构连动句语义标注
- 基于短文本隐含语义特征的文本蕴涵识别被引量:3
- 2016年
- 该文采用基于短文本隐含空间语义特征改进文本蕴涵识别,该方法通过构造句子的隐含变量模型,并融合基于该模型的句子之间相似度特征,和词汇重叠度、N元语法重叠度、余弦相似度等字符串特征,以及带标记和未标记的子树重叠度句法特征一起利用SVM进行分类。基于该分类算法,我们对RTE-8任务进行了测试,实验表明短文本的隐含语义特征可有效改进文本蕴涵关系识别。
- 张晗盛雅琦吕晨姬东鸿
- 关键词:支持向量机
- 基于搜索交互信息和用户搜索意图的词义提取方法
- 本发明公开了一种基于搜索交互信息和用户搜索意图的词义提取方法,依次包括步骤:记录每个用户的历史交互信息;取所有用户查询频率排名前K1位的查询关键字构建查询关键字向量;取每个用户自身查询频率前K2位的查询关键字查询后的对应...
- 姬东鸿孙程吕晨滕冲
- 基于受限的语义依存分析的文本推理方法
- 本发明公开了一种基于受限的语义依存分析的文本推理方法,包括以下步骤:步骤一、根据语义依存的表示机制,建立一个汉语文本推理标注资源,其中,一个文本推理标注实例包含一个语段<I>T</I>、一个假设<I>H</I>、假设<I...
- 姬东鸿吕晨滕冲张明尧孙程陈波汪辉史华新韩欣吴龙飞
- 面向生物文本挖掘的语义标注研究
- 2015年
- 文章提出了一个新颖的模型——"基于特征结构的递归有向图",将其用于描述英文生物文本中定语后置的语义关系。后置定语的用法是复杂多变的,主要有三类情况:现在分词充当后置定语,过去分词充当后置定语,介词短语充当后置定语,这为自动分析带来很多难题。我们总结和标注了这三类后置定语的语义信息。与依存结构相比,特征结构可以形式化为可递归的有向图,标注结果表明递归有向图更适合与生物文本挖掘中的复杂语义关系抽取。
- 陈波吕晨魏小梅
- 关键词:语义标注后置定语
- 基于混合主题模型的文本蕴涵识别被引量:2
- 2015年
- 分析识别文本蕴涵的主流方法,并基于文本T和假设H可以从潜在混合主题中生成的猜想,提出一个混合主题模型来识别文本蕴涵,描述一个在混合主题模型上生成文本的概率模型。该模型把文本T和假设H看成是同一语义的不同表达,表示为多模式的数据,若文本T和假设H有蕴涵关系,则它们有相似的主题分布,共享混合词汇表和主题。设计mix LDA和LDA模型的对比实验,并对RTE-8任务进行测试,通过支持向量机对得到的句子相似度和其他词法句法特征进行分类。实验结果表明,基于混合主题模型的文本蕴涵识别具有较高的准确率。
- 盛雅琦张晗吕晨姬东鸿
- 关键词:主题模型多模式支持向量机
- 基于搜索交互信息和用户搜索意图的词义提取的搜索方法
- 本发明公开了一种基于搜索交互信息和用户搜索意图的词义提取方法,依次包括步骤:记录每个用户的历史交互信息;取所有用户查询频率排名前K1位的查询关键字构建查询关键字向量;取每个用户自身查询频率前K2位的查询关键字查询后的对应...
- 姬东鸿孙程吕晨滕冲
- 文献传递