您的位置: 专家智库 > >

刘占一

作品数:4 被引量:11H指数:1
供职机构:百度股份有限公司更多>>
发文基金:国家科技重大专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文

领域

  • 3篇自动化与计算...
  • 1篇语言文字

主题

  • 3篇机器翻译
  • 3篇翻译
  • 3篇搭配
  • 2篇统计机器
  • 2篇统计机器翻译
  • 2篇翻译模型
  • 1篇英语
  • 1篇语料库
  • 1篇双语语料
  • 1篇双语语料库
  • 1篇机器翻译系统
  • 1篇汉英翻译
  • 1篇汉语
  • 1篇翻译规则
  • 1篇翻译系统

机构

  • 4篇哈尔滨工业大...
  • 1篇百度股份有限...

作者

  • 4篇刘占一
  • 3篇刘挺
  • 3篇李生
  • 1篇杨沐昀
  • 1篇王海峰

传媒

  • 1篇软件学报
  • 1篇黑龙江工程学...

年份

  • 1篇2012
  • 1篇2011
  • 1篇2010
  • 1篇2003
4 条 记 录,以下是 1-4
排序方式:
一种改进的层次短语翻译模型
基于层次短语的统计翻译模型融合了短语和句法两方面的信息,已经成为当前统计机器翻译的主流模型之一。由于传统的层次短语模型没有考虑词汇的内在联系,导致待翻译句子中常用短语(如搭配词组)的译文可能由多个译文片段组合得到,从而造...
刘占一刘挺李生
关键词:统计机器翻译搭配
文献传递
一种改进的层次短语翻译模型
基于层次短语的统计翻译模型融合了短语和句法两方面的信息,已经成为当前统计机器翻译的主流模型之一。由于传统的层次短语模型没有考虑词汇的内在联系,导致待翻译句子中常用短语(如搭配词组)的译文可能由多个译文片段组合得到,从而造...
刘占一刘挺李生
关键词:统计机器翻译搭配
文献传递
利用统计搭配模型改进基于实例的机器翻译被引量:11
2012年
基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3个方面提高EBMT的性能:(1)利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度,从而增强系统的翻译实例选择能力;(2)通过引入候选译文与上下文之间搭配强度的估计来提高译文选择能力;(3)使用统计搭配模型检测翻译实例中被替换词的搭配词,同时根据新的替换词及上下文对搭配词进行矫正,进一步提高EBMT系统的译文质量.为了验证所提出的方法,在基于词的EBMT系统上评价了英汉翻译的译文质量.与基线系统相比,所提出的方法使译文的BLEU得分提高了4.73~6.48个百分点.在半结构化的EBMT系统上进一步检验了基于统计搭配模型的译文选择方法,从实验结果来看,该方法使译文的BLEU得分提高了1.82个百分点.同时,人工评价结果显示,改进后的半结构化EBMT系统的译文能够表达原文的大部分信息,并且具有较高的流利度.
刘占一李生刘挺王海峰
从双语语料库中获取汉英翻译规则的研究
2003年
实用化的机器翻译系统一般采取基于规则的方法,而长久以来手工调试是翻译系统的主要知识源。为了解决手工汉英翻译规则获取这一瓶颈问题,提出了一种基于翻译等价对的自动获取方法,应用到汉英之间比较典型的“数-量-名”结构的翻译规则自动获取,取得了令人满意的结果。
刘占一杨沐昀
关键词:机器翻译系统汉语英语双语语料库翻译规则
共1页<1>
聚类工具0