您的位置: 专家智库 > >

叶娜

作品数:37 被引量:80H指数:5
供职机构:沈阳航空航天大学更多>>
发文基金:国家自然科学基金辽宁省教育厅高等学校科学研究项目教育部人文社会科学研究基金更多>>
相关领域:自动化与计算机技术文化科学语言文字更多>>

文献类型

  • 22篇期刊文章
  • 11篇专利
  • 4篇会议论文

领域

  • 28篇自动化与计算...
  • 2篇文化科学
  • 1篇语言文字

主题

  • 21篇翻译
  • 15篇机器翻译
  • 11篇译文
  • 8篇短语
  • 5篇语言
  • 4篇译文质量
  • 4篇用户
  • 4篇源语
  • 4篇源语言
  • 4篇解码
  • 4篇句法
  • 4篇句子
  • 3篇多特征融合
  • 3篇语境
  • 3篇统计机器
  • 3篇统计机器翻译
  • 3篇相似度
  • 3篇隶属函数
  • 3篇名词
  • 3篇名词短语

机构

  • 34篇沈阳航空航天...
  • 3篇沈阳航空工业...
  • 1篇南京航空航天...

作者

  • 37篇叶娜
  • 26篇蔡东风
  • 9篇张桂平
  • 3篇任晓娜
  • 3篇白宇
  • 3篇韩亚冬
  • 3篇于水
  • 2篇王裴岩
  • 2篇季铎
  • 2篇马斌
  • 1篇陈小芳
  • 1篇曾凡超
  • 1篇周俏丽
  • 1篇白宇
  • 1篇李楠
  • 1篇王迎春
  • 1篇张亚鹏
  • 1篇陈小芳
  • 1篇张华

传媒

  • 10篇中文信息学报
  • 6篇沈阳航空航天...
  • 2篇沈阳航空工业...
  • 1篇厦门大学学报...
  • 1篇计算机应用
  • 1篇小型微型计算...
  • 1篇计算机科学
  • 1篇第五届全国信...

年份

  • 3篇2023
  • 1篇2022
  • 3篇2021
  • 3篇2020
  • 7篇2018
  • 4篇2017
  • 1篇2016
  • 2篇2015
  • 1篇2014
  • 1篇2012
  • 4篇2011
  • 5篇2010
  • 2篇2009
37 条 记 录,以下是 1-10
排序方式:
一种基于语境的词语相似度计算方法被引量:12
2010年
词语相似度计算是机器翻译、信息检索等自然语言处理领域的关键问题之一。传统的词语相似度计算方法,未能很好地考虑上下文信息对词语语义的约束,从而不能对语境变换带来的词语间相似度的差异进行有效的区分。该文引入模糊数学中隶属函数的概念计算词语上下文信息的模糊重要度,并结合基于《知网》的语义相似度计算方法,提出一种基于语境的词语相似度计算方法。实验表明,该算法可以根据语境有效地区分语义相近的词语。
蔡东风白宇于水叶娜任晓娜
关键词:计算机应用中文信息处理语境词语相似度隶属函数
基于用户行为模型的计算机辅助翻译方法被引量:3
2011年
与全自动机器翻译相比,计算机辅助翻译技术更具实用性,已成为机器翻译领域的一个研究热点。传统的辅助翻译过程中,用户只能被动接受系统提供的辅助译文,并进行翻译后编辑操作。该文提出一种基于用户行为模型的辅助翻译方法,通过实时记录用户的后编辑过程,分析出用户的翻译决策,建立用户行为模型,使得翻译系统能够动态获取和共享用户的翻译知识,从而提高辅助译文的质量。实验结果表明,在同一篇文档前30%文本的后编辑过程中建立的用户行为模型,使余下70%文本的辅助译文的BLEU值平均提高了4.9%,用户模型中翻译知识的准确率达到94.1%。
叶娜张桂平韩亚冬蔡东风
关键词:辅助翻译用户行为模型
基于最长名词短语分治策略的神经机器翻译被引量:6
2018年
神经机器翻译自兴起以来,不断给机器翻译领域带来振奋人心的消息。但神经机器翻译没有显式地利用语言学知识对句子结构进行分析,因此对结构复杂的长句翻译效果不佳。该文基于分治法的思想,识别并抽取句子中的最长名词短语,保留特殊标识或核心词,与其余部分组成句子框架。通过神经机器翻译系统分别翻译最长名词短语和句子框架,再将译文重新组合,缓解了神经机器翻译对句子长度敏感的问题。实验结果表明,该方法获得的译文与基线系统相比,BLEU分值提升了0.89。
张学强蔡东风叶娜吴闯
关键词:分治策略
基于最长名词短语分治策略的神经机器翻译
神经机器翻译自兴起以来,不断给机器翻译领域带来振奋人心的消息.但神经机器翻译没有显式地利用语言学知识对句子结构进行分析,因此对结构复杂的长句翻译效果不佳.本文基于分治法的思想,识别并抽取句子中的最长名词短语,保留特殊标识...
张学强蔡东风叶娜吴闯
关键词:分治策略
一种基于语境的词语相似度计算方法
词语相似度计算是机器翻译、信息检索等自然语言处理领域的关键问题之一。传统的词语相似度计算方法,未能很好地考虑上下文信息对词语语义的约束,从而不能对语境变换带来的词语间相似度的差异进行有效的区分。本文引入模糊数学中隶属函数...
白宇于水叶娜蔡东风任晓娜
关键词:语境词语相似度隶属函数
文献传递
一种多特征融合的句子级译文质量估计方法
本发明公开一种多特征融合的句子级译文质量估计方法,包括以下步骤:1)并行提取词预测特征、语境化词嵌入特征、依存句法特征以及基线特征;2)上述特征提取后,分别对各特征进行进一步整合,针对特征向量采用将各特征由Bi‑LSTM...
叶娜王远远蔡东风
从计算机辅助翻译到协同翻译被引量:21
2012年
由于机器翻译系统的译文质量仍难以达到实用化要求,计算机辅助翻译技术逐渐成为研究热点,并且取得了很好的实际效果,大大提高了翻译产业的生产率。随着辅助翻译规模的不断扩大,多名在空间上分散的用户被组织起来共同完成一项翻译任务已成为普遍现象,这种新的翻译模式称为协同翻译。该文对计算机辅助翻译和协同翻译技术进行综述,首先从辅助译文生成、译后编辑和系统反馈学习等方面介绍了计算机辅助翻译技术的常用方法和研究进展,随后讨论了计算机辅助翻译与协同翻译之间的联系和区别,分析了协同翻译技术所面临的主要问题,并介绍了现有研究的解决方法。最后对协同翻译的未来发展方向进行了展望。
叶娜张桂平韩亚冬蔡东风
关键词:计算机辅助翻译用户
基于深度语义关联的译文预测方法
本发明涉及一种基于深度语义关联的译文预测方法,包括以下步骤:1)生成词向量:利用Wordto Vec工具,使用Skip‑gram模型在训练语料上进行训练,把生成的词向量加载到模型中,以备使用;2)语义相关度计算:利用词向...
叶娜
文献传递
基于分类策略的术语识别系统融合被引量:1
2015年
近年来,基于机器学习方法的术语识别取得了不错的效果.然而,不同系统往往由于采用不同的学习方法或特征集而各有特点,他们在统计意义上性能接近的同时,在具体表现上却存在差异,那么,如何融合各个系统的不同特点和差异以求进一步提升术语识别的效果变得很有价值.针对该问题并结合这些系统自身的特点,提出一种基于分类策略的术语识别系统融合方法.该方法将融合问题看作一个二分类问题,同时,在分类器的设计过程中更加灵活和更多地整合了上下文信息和依存句法信息.在中文术语识别实验中的结果验证了该方法的有效性,融合后的结果好于每一个单系统.
张华叶娜周俏丽蔡东风
利用质量估计改进无监督神经机器翻译被引量:4
2021年
传统上神经机器翻译依赖于大规模双语平行语料,而无监督神经机器翻译的方法避免了神经机器翻译对大量双语平行语料的过度依赖,更适合低资源语言或领域。无监督神经机器翻译训练时会产生伪平行数据,这些伪平行数据质量对机器翻译最终质量起到了决定性的作用。因此,该文提出利用质量估计的无监督神经机器翻译模型,通过在反向翻译的过程中使用质量估计对生成的伪平行数据评分,再选择评分(HTER)较高的平行数据训练神经网络。利用质量估计的方法可以控制反向翻译生成的伪平行数据的质量,为对抗生成网络提供了更丰富的训练样本,使对抗生成网络训练得更加充分。与基线模型相比,该模型在WMT 2019德语—英语和捷克语—英语新闻单语语料上BLEU值分别提升了0.79和0.55。
徐佳叶娜张桂平黎天宇
共4页<1234>
聚类工具0