您的位置: 专家智库 > >

应玉龙

作品数:5 被引量:15H指数:2
供职机构:中国科学院合肥智能机械研究所更多>>
发文基金:国家自然科学基金中国科学院知识创新工程国家科技支撑计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 3篇期刊文章
  • 2篇会议论文

领域

  • 4篇自动化与计算...
  • 1篇语言文字

主题

  • 2篇对齐
  • 2篇机器翻译
  • 2篇翻译
  • 2篇词对齐
  • 1篇对应表
  • 1篇形态学
  • 1篇中科院
  • 1篇数字信息
  • 1篇随机场
  • 1篇条件随机场
  • 1篇统计模型
  • 1篇评测
  • 1篇蒙古文
  • 1篇解码
  • 1篇解码算法
  • 1篇古文
  • 1篇词干
  • 1篇词素
  • 1篇词性
  • 1篇词性标注

机构

  • 5篇中国科学院
  • 2篇内蒙古大学
  • 2篇中国科学技术...

作者

  • 5篇应玉龙
  • 3篇李淼
  • 3篇乌达巴拉
  • 3篇朱海
  • 2篇雪艳
  • 2篇李文

传媒

  • 2篇计算机应用
  • 1篇中文信息学报
  • 1篇第二届全国少...
  • 1篇第五届全国机...

年份

  • 1篇2011
  • 1篇2010
  • 2篇2009
  • 1篇2008
5 条 记 录,以下是 1-5
排序方式:
基于阿拉伯数字中介的汉蒙数词对齐策略被引量:2
2009年
在汉蒙词对齐任务的背景下,针对数词这一特殊的词类,提出了以阿拉伯数字作为转换中介的对齐方法。其基本思想是,将汉蒙文本中的数词分别转换为阿拉伯数字后再决定它们之间是否存在对应关系,即是否可以成为一个对齐连接。转换过程建立在汉蒙基本数词与阿拉伯数字信息对应表——numtable的基础上。numtable中设置了"标志位"信息,用以标明基本数词是否为"10"的倍数。数词到阿拉伯数字的转换模块依据numtable中的"标志位"信息,经过推理,将汉蒙数词分别转换为相应的阿拉伯数字。在实现转换时,不仅考虑了汉语数词和蒙古语数词各自的特征,而且以"词对齐"作为目标,对每一种语言内部不同类型的数词分别采取了不同的转换策略。
雪艳应玉龙
基于阿拉伯数字中介的汉蒙数词对齐策略
在汉蒙词对齐任务的背景下,我们针对数词这一特殊的词类,提出了以阿拉伯数字作为转换中介的对齐方法。其基本思想是,将汉蒙文本中的数词分别转换为阿拉伯数字后再决定它们之间是否存在对应关系,即是否可以成为一个对齐连接。转换过程建...
雪艳应玉龙
文献传递
第五届全国机器翻译研讨会中科院智能所评测技术报告
描述了中科院智能所参加第五届全国机器翻译研讨会(CWMT09)评测的系统。本单位参加了CWMT09的单一系统、机器翻译和系统融合三个项目。主系统是一个基于短语的统计机器翻译系统,其解码器采用逆向递归的解码算法,对比系统为...
朱海应玉龙李文李淼乌达巴拉
关键词:机器翻译解码算法
文献传递
基于短语统计机器翻译模型蒙古文形态切分被引量:4
2011年
该文结合最小上下文构成代价模型,借鉴并利用统计机器翻译的方法,尝试解决蒙古文形态切分问题。基于短语的统计机器翻译形态蒙文切分模型和最小上下文构成代价模型分别对词表词和未登录词进行形态切分。前者选取了短语机器翻译系统中三个常用的模型,包括短语翻译模型、词汇化翻译模型和语言模型,最小上下文构成代价模型考虑了一元词素上下文环境和词缀N-gram上下文环境。实验结果显示:基于短语统计机器翻译形态切分模型对词表词切分,最小上下文构成代价模型对未登录词处理后,总体的切分准确率达到96.94%。此外,词素融入机器翻译系统中后,译文质量有了显著的提高,更进一步的证实了本方法的有效性和实用性。
李文李淼梁青朱海应玉龙乌达巴拉
关键词:形态学机器翻译统计模型
基于条件随机场的蒙古语词性标注方法被引量:10
2010年
为了保留蒙古语词缀中大量的语法、语义信息和缩小蒙古语词典的规模,蒙古语词性标注需要对词干和词缀都进行词性标注。针对这一问题提出了一种基于条件随机场(CRF)的蒙古语词性标注方法。该方法利用CRF模型能够添加任意特征的特点,充分使用蒙文上下文信息,针对词素之间的相互影响添加了新的统计特征,并在3.8万句的蒙古语词性标注语料上进行了封闭测试,该方法的标注准确率达到了96.65%,优于使用隐马尔可夫模型(HMM)的词性标注模型。
应玉龙李淼乌达巴拉朱海
关键词:词干词缀条件随机场词性标注词素
共1页<1>
聚类工具0