郭稷
- 作品数:5 被引量:13H指数:1
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于Web的新词翻译知识获取研究
- 本文提到的“新词”,是指在词典中未出现的词,一般包括命名实体(即人名、地名、机构名)、书名、电影名、科学术语、医学术语、军事术语等。这些词携带了大量的信息,因此,新词的翻译对于统计机器翻译、跨语言检索、自动问答等系统的性...
- 郭稷
- 关键词:新词翻译知识获取网络挖掘跨语言检索
- 一种有效的基于Web的双语翻译对获取方法
- 命名实体和新词、术语的翻译对机器翻译、跨语言检索、自动问答等系统的性能有着重要的影响,但是这些翻译很难从现有的翻译词典中获得。
本文提出了一种从中文网页中自动获取高质量双语翻译对的方法。该方法利用网页中双语翻译...
- 郭稷吕雅娟刘群
- 关键词:文字处理双语翻译数理语言学
- 文献传递
- 一种有效的基于Web的双语翻译对获取方法被引量:13
- 2008年
- 命名实体和新词、术语的翻译对机器翻译、跨语言检索、自动问答等系统的性能有着重要的影响,但是这些翻译很难从现有的翻译词典中获得。该文提出了一种从中文网页中自动获取高质量双语翻译对的方法。该方法利用网页中双语翻译对的特点,使用统计判别模型,融合多种识别特征自动挖掘网站中存在的双语翻译对。实验结果表明,采用该模型构建的双语翻译词表,TOP1的正确率达到82.1%,TOP3的正确率达到94.5%。文中还提出了一种利用搜索引擎验证候选翻译的方法,经过验证,TOP1的正确率可以提高到84.3%。
- 郭稷吕雅娟刘群
- 关键词:计算机应用中文信息处理网络挖掘
- 一种基于索引模型融合的面向问答的信息检索方法
- IR4QA(Information Retrieval for Question Answering)是日本国立情报局组织举办的第7届国际跨语言检索评测(NTCIR-7)提出的新任务,其目的是研究信息检索和问答技术融合的...
- 郭稷骆卫华
- 关键词:信息检索
- 文献传递
- 一种有效的基于Web的双语翻译对获取方法
- 命名实体和新词、术语的翻译对机器翻译、跨语言检索、自动问答等系统的性能有着重要的影响,但是这些翻译很难从现有的翻译词典中获得。本文提出了一种从中文网页中自动获取高质量双语翻译对的方法。该方法利用网页中双语翻译对的特点,使...
- 郭稷吕雅娟刘群
- 文献传递