搜索到87篇“ 词语对齐“的相关文章
- 一种双语词语对齐方法及系统
- 本发明提供一种双语词语对齐方法及系统,该方法包括:获取源语种词向量和目标语种词向量;将所述源语种词向量和目标语种词向量输入到训练好的词语对齐优化模型中,获取正交变换矩阵;其中,所述训练好的词语对齐优化模型是由无监督模块和...
- 张勇赵旭王子豪李欣李超
- 一种双语词语对齐方法及系统
- 本发明提供一种双语词语对齐方法及系统,该方法包括:获取源语种词向量和目标语种词向量;将所述源语种词向量和目标语种词向量输入到训练好的词语对齐优化模型中,获取正交变换矩阵;其中,所述训练好的词语对齐优化模型是由无监督模块和...
- 张勇赵旭王子豪李欣李超
- 文献传递
- 词语对齐分数算出装置、词语对齐装置、以及存储介质
- 本发明提供一种用于以高精度进行词语对齐的装置。该装置包括:接收对照翻译句对和针对该对照翻译句对的词语对齐,以规定的顺序依次选择第1语言的句子的词语f<Sub>j</Sub>的选择单元;和针对第1语言的句子的所有词语算出表...
- 田村晃裕渡边太郎隅田英一郎
- 文献传递
- 一种基于词语对齐模型的web评论情感分析方法
- 本发明属于自然语言处理情感分析领域,公开了一种基于词语对齐模型的web评论情感分析方法。该方法具体内容包括:从网页上获取评论信息并对这些内容进行预处理;基于改进的机器翻译模型,获取评论中的候选情感词和候选评价对象词;然后...
- 程红蓉唐明霜蔡腾远郭彦伟张锋
- 文献传递
- 融合句法特征的汉-老双语词语对齐算法研究
- 2018年
- 词语对齐技术一直是自然语言处理的基础问题。为实现汉―老双语自动词对齐,首先对老挝语存在的修饰词与中心词顺序倒置、结构和位置上的差异性等特征进行了分析,通过分析筛选出一些汉―老双语特征并将这些特征融合,对其构建特征函数,以最小错误率算法为条件,在对数线性模型框架下训练模型参数,将IBM3模型作为基础比较模型,通过逐步添加特征函数从而实现与基础模型的对比。实验证明,该方法可有效提高汉-老双语词对齐质量。
- 李思卓周兰江周枫郭剑毅
- 关键词:特征函数
- 汉—老双语词语对齐及依存树库构建方法研究
- 随着科技和社会经济的快速发展,伴随着跨语言沟通的不断深化,全球互联已成为不可抗拒的发展趋势。面对互联网上的数量巨大且实时动态变化的多语言信息,仅仅依赖人工翻译来处理这些数据简直就是天方夜谭,唯一的解决方案就是充分利用机器...
- 殷若尘
- 关键词:汉语老挝语词语对齐
- 文献传递
- 一种双向词语对齐方法及装置
- 本发明涉及一种双向词语对齐方法及装置,其中,方法包括构建源语言到目标语言的第一词语对齐模型和目标语言到源语言的第二词语对齐模型;利用一致性评估函数,融合两个方向的词语对齐模型,构建初始目标函数;利用一致性评估函数,对两个...
- 孙茂松柳春洋刘洋栾焕博刘奕群马少平
- 文献传递
- 词语对齐分数算出装置、词语对齐装置、以及计算机程序
- 本发明提供一种用于以高精度进行词语对齐的装置。该装置包括:接收对照翻译句对和针对该对照翻译句对的词语对齐,以规定的顺序依次选择第1语言的句子的词语f<Sub>j</Sub>的选择单元;和针对第1语言的句子的所有词语算出表...
- 田村晃裕渡边太郎隅田英一郎
- 基于深层神经网络(DNN)的汉-越双语词语对齐方法被引量:3
- 2016年
- 针对汉-越双语因语言特点差异较大而导致难以实现词语自动对齐的问题,提出了一种基于深层神经网络(deep neural network,DNN)的汉-越双语词语对齐方法。该方法先将汉-越双语词语转化成词向量,作为DNN模型的输入,再通过调整和扩展HMM模型,并融入上下文信息,构建DNN-HMM词语对齐模型。实验以HMM模型和IBM4模型为基础模型,通过大规模的汉-越双语词语对齐任务表明,该方法的准确率、召回率较两个基础模型都有明显的提高,而词语对齐错误率大大降低。
- 莫媛媛郭剑毅余正涛毛存礼牛翊童
- 关键词:越南语词语对齐DNN
- 一种基于词语对齐模型的web评论情感分析方法
- 本发明属于自然语言处理情感分析领域,公开了一种基于词语对齐模型的web评论情感分析方法。该方法具体内容包括:从网页上获取评论信息并对这些内容进行预处理;基于改进的机器翻译模型,获取评论中的候选情感词和候选评价对象词;然后...
- 程红蓉唐明霜蔡腾远郭彦伟张锋
相关作者
- 刘群

- 作品数:210被引量:1,628H指数:19
- 供职机构:中国科学院计算技术研究所
- 研究主题:机器翻译 统计机器翻译 翻译模型 自然语言处理 源语言
- 雪艳

- 作品数:13被引量:21H指数:2
- 供职机构:中央民族大学
- 研究主题:词语对齐 语料库 平行语料库 词语 词对齐
- 那顺乌日图

- 作品数:54被引量:137H指数:8
- 供职机构:内蒙古大学
- 研究主题:蒙古语 蒙古文 机器翻译 蒙古语语法信息词典 信息处理
- 孙茂松

- 作品数:358被引量:2,398H指数:25
- 供职机构:清华大学
- 研究主题:向量 中文信息处理 机器翻译 句子 自然语言处理
- 罗维

- 作品数:3被引量:0H指数:0
- 供职机构:中国科学院计算技术研究所
- 研究主题:词语对齐 统计机器翻译 期望最大化