国家自然科学基金(61073126)
- 作品数:3 被引量:23H指数:2
- 相关作者:刘挺秦兵张牧宇宋原伍大勇更多>>
- 相关机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于随机游走模型的查询日志中命名实体挖掘被引量:3
- 2012年
- 提出了一种弱指导的方法从搜索引擎查询日志中挖掘命名实体。该方法中采用人工选择的少量命名实体名称作为种子,使用随机游走模型从查询日志中获得大量的命名实体。其中采用了查询日志中的实体上下文模板,用户点击URL和候选命名实体构建三分图,根据在该图上的随机游走计算候选命名实体属于指定目标实体类别的概率,从而在查询日志中获取该类别的命名实体。在真实的查询日志上对7个实体类别进行的实验,实验结果显示本文方法在各个类别上均获得较好的命名实体挖掘效果。
- 伍大勇刘挺
- 关键词:查询随机游走
- 中文篇章级句间语义关系识别被引量:20
- 2013年
- 篇章句间关系识别(Discourse Relation Recognition)是篇章分析的重要内容,该文对中文篇章句间关系识别任务进行初步探索,包括显式篇章句间关系识别与隐式篇章句间关系识别两类任务。针对显式篇章句间关系,我们提出基于关联词规则的方法进行识别,取得了很好的效果;针对隐式篇章句间关系,我们抽取词汇、句法、语义等特征,采用有指导模型进行识别。该文的分析和实验结果为后续研究提供了参考和基本对照系统。
- 张牧宇宋原秦兵刘挺
- 中文篇章关系任务分析及语料标注被引量:2
- 2016年
- 篇章关系(Discourse Relation)是篇章语义分析的重要内容,本文在英文篇章关系研究的基础上分析了中英文间的差异,总结了中文篇章语义分析的特点,并在此基础上提出面向中文的层次化篇章关系体系,对其关系类型进行详细描述。在其基础上,研究构建包含1 096篇语料的中文篇章关系语料库,为进一步的篇章语义分析工作奠定基础。
- 张牧宇秦兵刘挺
- 关键词:语义分析