连乐新
- 作品数:3 被引量:22H指数:2
- 供职机构:南京大学计算机科学与技术系计算机软件新技术国家重点实验室更多>>
- 发文基金:国家科技基础条件平台建设计划国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于中文宾州树库的浅层语义分析被引量:8
- 2008年
- 采用支持向量机的机器学习方法,以中文宾州树库为基础,对中文文本进行了部分语义角色标注实验。选取了主语、宾语、间接宾语、时间和地点这五种主要的语义角色,以中文PropBank 5.0中的前1 652个句子作为实验的训练集和测试集,选择路径、短语类型、谓词、头词、头词词性等八个属性作为分类特征,采用两阶段分类方法,在测试集上得到的总体语义角色标注的准确率和召回率分别为89.73%和91.26%。实验结果表明该方法对中文浅层语义分析工作是有效的。
- 连乐新胡仁龙杨翠丽袁春风
- 关键词:支持向量机语义角色标注
- 基于本体的实例信息抽取与匹配技术研究
- 随着计算机应用的广泛普及以及互联网技术的飞速发展,人们可共享和利用的信息资源越来越丰富,目前面临的关键问题是如何帮助用户从这些丰富的信息资源中获取所需要的有用信息。自动问答是一种使得人们能够更加快速、准确地获取信息的新的...
- 连乐新
- 关键词:信息抽取计算机网络信息处理本体
- 基于标点符号分割的汉语句法分析算法被引量:13
- 2007年
- 目前大部分句法解析器都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出单独解析块的概念,并且根据标点符号在句子中的特有特征和位置关系,给出了基于决策树算法(Id3)单独解析块识别方法,将标点融入汉语句法分析中。本文所用的实验数据(包括训练集和测试集)均来自中文宾州树库5.0。对句长大于40个词的汉语长句单独进行了实验,句法分析精度和召回率分别提高1.59%和0.93%,同时时间开销降低了近2/3。实验结果表明,标点对汉语长句句法分析非常有利,系统性能获得了较大提高。
- 毛奇连乐新周文翠袁春风
- 关键词:计算机应用中文信息处理