您的位置: 专家智库 > >

王云兰

作品数:1 被引量:0H指数:0
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇特征选取
  • 1篇最大熵
  • 1篇最大熵原理
  • 1篇汉语词性
  • 1篇汉语词性标注
  • 1篇词性标注

机构

  • 1篇河南省科学技...

作者

  • 1篇刘小可
  • 1篇王云兰

传媒

  • 1篇光盘技术

年份

  • 1篇2007
1 条 记 录,以下是 1-1
排序方式:
一个改进的基于最大熵原理的汉语词性标注系统
2007年
本文研究了基于最大熵原理的汉语词性标注。文章采用了准确率增量驱动的上下文特征选取策略,而后采用EM算法量化了特征之间的相依程度,并将其作为概率特征引入到统一的特征表示框架;建模过程充分利用了语法词典中的知识,针对外部词汇构造了伪事件,并将词的候选词性限制在一个特定的子集内,有效缩减了词性标记的搜索范围。文章以北京大学人民日报标记语料作为试验数据,验证了该方法的有效性。
刘小可王云兰
关键词:最大熵特征选取汉语词性标注
共1页<1>
聚类工具0