您的位置: 专家智库 > >

杨丹

作品数:1 被引量:4H指数:1
供职机构:中国电力科学研究院更多>>
发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家语委科研项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇语词
  • 1篇语料
  • 1篇语料库
  • 1篇双语
  • 1篇双语词典
  • 1篇向量
  • 1篇可比语料库
  • 1篇抽取
  • 1篇抽取方法
  • 1篇词典

机构

  • 1篇华中师范大学
  • 1篇中国电力科学...

作者

  • 1篇李波
  • 1篇陈鹏
  • 1篇杨丹
  • 1篇李舰

传媒

  • 1篇小型微型计算...

年份

  • 1篇2017
1 条 记 录,以下是 1-1
排序方式:
基于可比语料库的双语词典抽取方法比较研究被引量:4
2017年
双语词典是一种重要的语言资源,但现有的基于可比语料库的双语词典抽取方法在体系结构、所依赖的基础性资源等方面差异较大,这使得在统一的实验条件下对各种算法进行比较变得很困难.因此,目前的研究工作多选择将性能评测任务限定在很狭小的范围内,缺乏统一的评测结果给双语词典抽取任务的发展和算法的选择带来一定困难.为解决上述问题,选取并实现了四种代表性的双语词典抽取方案,在统一的测试数据集上进行比较研究.在比较研究中,我们重点揭示了词典抽取任务中几种关键因素如语料库大小、训练词典大小等对各算法性能的不同影响程度.本文的结论对今后相关工作中的实验设计、性能比较与算法选用都具有重要的理论意义和实践价值.
李舰李波陈鹏杨丹
关键词:可比语料库
共1页<1>
聚类工具0