王天航
- 作品数:3 被引量:8H指数:2
- 供职机构:北京理工大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于错误驱动学习策略的藏语句法功能组块边界识别被引量:7
- 2014年
- 藏语句法功能组块分析旨在识别出藏语句子的句法成分,为后续句子级深入分析提供支持。根据藏语的语言特点,该文在藏语句法功能组块描述体系基础上,提出基于错误驱动学习策略的藏语功能组块边界识别方法。具体思路为,首先基于条件随机场(Conditional Random Fields,CRFs)识别组块,然后分别基于转换规则的错误驱动学习(Transformation-based Error-driven Learning,TBL)及基于新特征模板的CRFs错误驱动学习进行二次识别,并对初次结果进行校正,F值分别提高了1.65%、8.36%。最后通过实验分析,进一步将两种错误驱动学习机制融合,在18 073词级的藏语语料上开展实验,识别性能进一步提高,准确率、召回率与F值分别达到94.1%、94.76%与94.43%,充分验证了本文提出方法的有效性。
- 王天航史树敏龙从军黄河燕李琳
- 关键词:CRFSTBL
- 一种音节粒度的藏语句法组块识别方法及装置
- 本发明涉及一种音节粒度的藏语句法组块识别方法及装置,属于计算机应用技术中的机器翻译技术领域。本发明首先通过对原始藏语语料进行预处理,删除其中非藏语语言文本,然后利用预先训练好的句法标记识别模型M<Sub>1</Sub>进...
- 史树敏王天航黄河燕龙从军
- 文献传递
- 面向机器翻译的藏语功能组块识别研究
- 随着藏语基础研究的不断深入、藏语信息处理取得了很大进展。针对藏语语言进行句法分析、语义理解等更深层次的探索逐渐成为目前的研究热点。特别是藏语句法功能组块的研究对于藏语智能化信息处理具有重要的理论价值与现实意义。一方面,从...
- 王天航
- 关键词:藏语机器学习模型
- 文献传递