您的位置: 专家智库 > >

关真珍

作品数:3 被引量:9H指数:1
供职机构:中国科学院计算机语言信息工程研究中心更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技型中小企业技术创新基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 2篇督导
  • 2篇分词
  • 1篇信息处理
  • 1篇语言模型
  • 1篇软件体系结构
  • 1篇体系结构
  • 1篇中文
  • 1篇中文分词
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇最大期望算法
  • 1篇基于WEB服...
  • 1篇分词算法
  • 1篇EM算法
  • 1篇WEB服务

机构

  • 2篇中国科学院
  • 1篇华中科技大学
  • 1篇中国科学技术...

作者

  • 3篇关真珍
  • 2篇黄河燕
  • 2篇冯冲
  • 2篇陈肇雄

传媒

  • 1篇中文信息学报

年份

  • 1篇2006
  • 2篇2004
3 条 记 录,以下是 1-3
排序方式:
基于Multigram语言模型的主动学习中文分词被引量:8
2006年
分词是中文处理中的重要基础问题。为了克服Web文本分析中传统方法在适应繁杂的专业领域和多变的语言现象时存在的困难,本文以无督导分词方法为基本框架,使用EM算法建立n元multigram语言模型,提出了一种基于置信度的主动学习分词算法,使得系统在主要利用大量未标注数据的同时,还能够主动选择少量最有价值的数据提交人工标注。实验结果表明算法性能优于相关的几种无督导分词算法。
冯冲陈肇雄黄河燕关真珍
关键词:中文信息处理分词EM算法
基于Web服务的机助翻译系统体系结构研究
网络技术的进步为数据密集或计算密集型的应用提供了大规模、分布式的处理能力。考虑到语言工程所必需的大量数据以及分析这些数据所需的高强度计算,结合新一代网络技术的软件体系结构研究将在语言工程领域发挥日益重要的作用。本文对基于...
冯冲陈肇雄黄河燕关真珍
关键词:WEB服务软件体系结构
文献传递
基于半督导机器学习的分词算法的设计与实现
词是最小的能独立运用的语言单位,汉语、日语等东方语言的一个显著特点是文本中词与词之间没有显式的分隔标记。因此,分词在机器翻译、信息检索、文本分类等中文信息处理的各项任务中都发挥着基础性的重要作用。 研究工作具有以下特点...
关真珍
关键词:最大期望算法分词算法
共1页<1>
聚类工具0