罗恒
- 作品数:5 被引量:18H指数:2
- 供职机构:兰州理工大学计算机与通信学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 应用条件随机场进行汉语词法分析、语块分析研究
- 介绍了词法分析、句法分析在自然语言理解研究中基础的、决定性的重要地位。针对目前词法分析、句法分析研究热点集中在基于规则方法和基于统计方法的联合应用,介绍了最大熵理论和最大熵理论对于自然语言理解研究的重要意义,并进一步介绍...
- 罗恒
- 关键词:汉语词法分析条件随机场最大熵
- 文献传递
- 应用条件随机场进行汉语词法分析、语块分析的研究
- 介绍了词法分析、句法分析在自然语言理解研究中基础的、决定性的重要地位。针对目前词法分析、句法分析研究热点集中在基于规则方法和基于统计方法的联合应用,介绍了最大熵理论和最大熵理论对于自然语言理解研究的重要意义,并进一步介绍...
- 罗恒
- 关键词:条件随机场最大熵自然语言理解
- 文献传递
- 应用条件随机场进行汉语词法分析研究被引量:6
- 2007年
- 中文分词是一个困难的、重要的被广泛研究的序列数据建模问题。以往应用条件随机场进行汉语分词时,将分词转化为对汉字的标注,造成了大量的冗余的候选切分,以至于在分词过程中大大降低了分词的速度。提出了使用词图作为基础的标记序列来完成汉语的词法分析,这样充分利用了现有的词典资源,在属性框架的选择时也可以方便地融合语言知识,并且长度歧视及状态歧视方面的影响也被减到最小。提出了应用条件随机场来构建统一的汉语词法分析。
- 王继曾罗恒刘宽任浩征
- 关键词:汉语词法分析条件随机场最大熵
- 基于统计的句法分析方法研究被引量:10
- 2006年
- 在概述统计句法分析主要特征的基础上,对目前主流分析方法进行了深入分析,提出了实用化的基于统计的句法分析器必须引入结构信息、上下文信息、词汇信息以及语义信息才能提高性能和可靠性的观点。总结了基于统计的汉语句法分析方法当前的研究现状,最后探讨了基于统计的汉语句法分析方法的不足之处和发展趋势。
- 王继曾任浩征罗恒刘宽
- 关键词:句法分析语料库汉语
- EM算法在统计自然语言处理中的应用被引量:2
- 2006年
- 在统计自然语言处理中会经常遇到一类参数估值问题,就是当观察数据为不完全数据时如何求解参数的最大似然估计,EM算法就是解决这类问题的经典算法。给出了EM算法的基本框架,结合HMM和PCFG模型给出如何应用EM算法求解参数的极大似然估计,讨论了EM算法的优点和不足之处。
- 王继曾刘宽任浩征罗恒
- 关键词:自然语言EM算法似然函数隐马尔科夫模型概率上下文无关文法