您的位置: 专家智库 > 作者详情>郑略省

郑略省

作品数:4 被引量:11H指数:2
供职机构:北京信息科技大学更多>>
发文基金:北京市教委科技发展计划国家自然科学基金国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 2篇专利

领域

  • 2篇自动化与计算...

主题

  • 3篇句法分析
  • 2篇登录
  • 2篇依存句法分析
  • 2篇语言学
  • 2篇随机场
  • 2篇同义
  • 2篇同义词
  • 2篇同义词词林
  • 2篇未登录词
  • 2篇计算语言
  • 2篇计算语言学
  • 1篇度条件
  • 1篇粘合
  • 1篇色标
  • 1篇数据稀疏
  • 1篇条件随机场
  • 1篇中文
  • 1篇中文机构名识...
  • 1篇字形
  • 1篇句法

机构

  • 4篇北京信息科技...
  • 1篇北京大学

作者

  • 4篇吕学强
  • 4篇郑略省
  • 2篇王玥
  • 1篇李卓
  • 1篇林进
  • 1篇刘坤

传媒

  • 1篇北京大学学报...
  • 1篇现代图书情报...

年份

  • 1篇2016
  • 2篇2014
  • 1篇2013
4 条 记 录,以下是 1-4
排序方式:
汉语并列关系的识别研究被引量:7
2013年
针对汉语并列关系的标注方式,提出一种基于条件随机场模型的并列关系自动识别方法。从语料库中自动抽取并列关系的角色信息,进行角色标注,在条件随机场模型的基础上实现并列关系的识别。与基于图的依存分析方法比较,并列关系的召回率和正确率分别提高了9.1%和13.8%。
郑略省吕学强刘坤林进
关键词:依存句法分析条件随机场角色标注
汉语依存树库中未登录词的处理方法
本发明属于计算语言学的自然语言处理领域,公开了一种汉语依存树库中未登录词的处理方法,该方法包括步骤:A,利用同义词词林,查找未登录词的所有同义词;B,根据汉字字形特征,计算未登录词与其所有同义词之间的字形相似度;C,当未...
吕学强郑略省王玥关晓炟
文献传递
用户查询日志中的中文机构名识别被引量:4
2014年
【目的】解决在用户查询日志中识别机构名的标注语料资源匮乏及信息不对称问题。【方法】提出一种自动构建用户查询日志机构名训练语料的方法,解决目前用户查询日志语料资源匮乏的问题。提出粘合度概念解决信息不对称问题,结合上下文等信息,采用条件随机场模型进行机构名识别。【结果】该方法在搜狗用户查询日志上的开放测试结果显示,机构名识别的正确率为72.80%,召回率为86.73%,F值为79.16%,比传统机构名识别方法在日志上的F值提高30%。【局限】语料构建方法仅仅是模拟查询日志的特点,但训练模型的误差仍然会大于规范化标注的查询日志语料;机构名表的数据量大小会影响模型对上下文知识学习的完备性。【结论】实验表明该方法应用于用户查询日志中的机构名识别是有效的。
关晓炟吕学强李卓郑略省
汉语依存树库中未登录词的处理方法
本发明属于计算语言学的自然语言处理领域,公开了一种汉语依存树库中未登录词的处理方法,该方法包括步骤:A,利用同义词词林,查找未登录词的所有同义词;B,根据汉字字形特征,计算未登录词与其所有同义词之间的字形相似度;C,当未...
吕学强郑略省王玥关晓炟
文献传递
共1页<1>
聚类工具0