国家自然科学基金(60375019)
- 作品数:10 被引量:14H指数:2
- 相关作者:赵铁军李生杨沐昀张春祥张姝更多>>
- 相关机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术建筑科学更多>>
- 机器翻译评价方法的实现及翻译系统聚类
- 五十年来,研究者提出了多种人工和自动化的机器翻译质量评价方法利用不同语言特征评价译文的质量。本文选择常用的自动和人工评价方法对6个翻译系统进行了实验。把分数归一化之后,利用系统聚类的方法获得了6个翻译系统的系统图及类间距...
- 姚建民赵铁军李生
- 关键词:系统聚类
- 文献传递
- 利用语义相似度解决双语词汇知识获取的错误累计问题被引量:1
- 2006年
- 在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方法.实验结果表明该方法行之有效.并对HowNet以及WordNet相似度计算方法进行了基于实际应用的对比与探讨后得出:HowNet在语义区分上粒度更细因此其召回率较高,WordNet则具有更高的精确率.
- 刘鹏远赵铁军李生杨沭昀
- 关键词:词对齐知识获取HOWNETWORDNET相似度语义词典
- Chinese Information Processing and Its Prospects被引量:1
- 2006年
- 李生赵铁军
- 关键词:信息处理语言处理计算语言学
- 面向奥运的汉英RBMT与EBMT研究被引量:1
- 2006年
- 介绍了采用基于实例的方法和基于规则的方法在面向奥运的汉英机器翻译系统的最新进展。揭示了二者不同的翻译处理过程和翻译知识学习机制。通过2003年和2005年两次863汉英测试的结果比较了二者的性能差别。采用4元Bleu指标作为评分标准,在2005年863评测中RBMT系统的篇章类得分为0.1056。对话类得分为0.1714;EBMT系统的篇章类得分为0.0718,对话类得分为0.1454。
- 蒋宏飞杨沐昀赵铁军
- 关键词:机器翻译
- 机器翻译系统跨领域移植方法的研究被引量:1
- 2005年
- 机器翻译系统跨领域移植是降低系统开发代价的关键性因素。论文以翻译模板对训练语料库机器译文评测分数的贡献为依据,对其进行评价。从模板库中过滤出适应目标领域的翻译知识,以实现系统向新领域的快速移植。利用论文所提出的方法将一个通用领域的机器翻译系统向旅游领域进行移植,并使用来自旅游领域的2469句汉语句子作为测试语料进行开放测试。实验结果表明在开放测试中,机器译文的5元Nist评分提高了2.2807,上升了71.1%。
- 张春祥赵铁军杨沐昀李生时晓升
- 关键词:机器翻译系统
- 面向事件的多语平行语料库构建研究被引量:6
- 2005年
- 讨论了面向北京奥运的多语语料库建设中的若干基础问题。提出了面向事件、多领域融合的语料收集原则,制定了具有分类信息的标注规范,初步建立了具有近七万句对的可控多语语料库。
- 张姝赵铁军杨沐昀李生
- 基于TBL的中文名实体识别后处理技术
- 中文名实体识别是自然语言处理当中一个富有难度和挑战性的课题。本文提出了一种改进的基于TBL 的后处理技术,它对学习到的规则集合进行优化,极大地提高了单个分类器的识别效果。并且该方法可以自动获取专门领域的语言特征知识。同时...
- 刘利刚谭红叶赵铁军杨沐昀
- 关键词:TBL后处理
- 文献传递
- 基于浅层句法信息的翻译实例获取方法研究
- 2009年
- 翻译实例库是基于实例的机器翻译系统的主要知识源。本文采用基于浅层句法分析的方法进行翻译实例的获取。首先根据浅层句法信息划分源语言和目标语言的翻译单元,然后在词对齐结果的指导下,利用统计对齐模型确定源语言和目标语言翻译单元之间的映射关系,从而获取翻译实例。通过与几种较具代表性的翻译实例获取方法进行对比实验发现,无论是对翻译实例库直接评测,还是通过EBMT系统进行间接评测,该方法都获得了令人满意的效果。
- 陈鄞赵铁军杨沐昀李生
- 关键词:浅层句法分析
- 基于译文加权的BLEU改进方法
- BLEU是目前机器翻译自动评价的主要方法之一。针对BLEU中不区分译文差别而平均分配权重的问题,本文应用线性回归方法计算不同词性译文权重,进而设计不同长度译文组合的权重计算方式.实验表明,相对于传统的BLEU方法,本文的...
- 朱俊国杨沐昀
- 关键词:机器翻译
- 文献传递
- 汉英EBMT系统的领域自适应研究
- EBMT系统在受限领域下可以高效地生成准确的译文,是目前应用较为成功的一种机器翻译技术。为了进一步解决此类系统面向不同应用领域时的自适应问题,本文提出应用文本分类技术。自动判别待翻译文本的类型,并选择对应的翻译实例库进行...
- 蒋宏飞杨沐昀刘海洁赵铁军
- 关键词:EBMT领域自适应文本分类
- 文献传递