您的位置: 专家智库 > >

国家社会科学基金(08BYY060)

作品数:2 被引量:5H指数:1
相关作者:刘扬陆顾婧俞士汶朱虹更多>>
相关机构:北京大学更多>>
发文基金:国家社会科学基金国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:语言文字自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 1篇语言文字

主题

  • 2篇汉语
  • 1篇信息处理
  • 1篇形容词
  • 1篇语词
  • 1篇语形
  • 1篇知识获取
  • 1篇知识库
  • 1篇知识库建设
  • 1篇实证
  • 1篇实证研究
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇最小描述长度
  • 1篇聚类
  • 1篇计算机
  • 1篇计算机应用
  • 1篇汉语词
  • 1篇汉语词义
  • 1篇汉语形容词

机构

  • 3篇北京大学

作者

  • 2篇刘扬
  • 1篇朱虹
  • 1篇朱虹
  • 1篇陆顾婧
  • 1篇俞士汶
  • 1篇刘扬

传媒

  • 1篇云南师范大学...
  • 1篇中文信息学报

年份

  • 1篇2012
  • 2篇2009
2 条 记 录,以下是 1-3
排序方式:
汉语形容词的自动词义区分研究被引量:1
2009年
词义知识获取是词义知识库建设、词义消歧等任务的基础和起点,目前该工作基本依赖人类专家的智慧和洞察力,在大规模文本处理上缺乏意义计算的客观性和一致性。该文以汉语的中高频形容词为样本,深入挖掘词义特征并采用有参数初始化过程的EM迭代算法,实现了从真实文本中自动发现并区分词语词义的过程。该词义区分算法选取易获取的词形特征、基于大规模语料的搭配特征、基于网络语料的属性—宿主关系特征,替代以往难以获取的句法结构特征,并进一步利用HowNet优化了词形特征的选择。该工作可以应用于信息检索等领域,能够对现有词典起到修改和补充的作用,该思路亦可扩展到其他汉语词类上去。
朱虹刘扬俞士汶
关键词:计算机应用中文信息处理知识获取EM算法
面向搭配知识库建设的汉语词义区分研究
针对当前搭配资源在描述框架和知识获取方面的不足,本文将词义研究和搭配研究结合起来,设计并实现基于搭配的汉语词义区分方法,期望利用词语的搭配特征区分词语的词义,同时,自动获取可区分词义的相关搭配知识。评测结果表明,利用最小...
朱虹刘扬俞士汶
关键词:搭配层次聚类最小描述长度
文献传递
汉英双语概念对应的实证研究被引量:4
2012年
揭示并评估不同语言之间的概念对应状况及词汇化程度,在语言对比研究和跨语言计算应用方面均有指标意义。北京大学开发的《中文概念词典》以WordNet框架为基础,在语言层面上较好地反映了汉语与英语之间的概念对应关系,以该资源为数据基础,并参照从《现代汉语语法信息词典》、《同义词词林》、《知网》等资源中提取的词集,本文实证地考察了汉英双语概念对应的实际情况及所能达到的词汇化程度,探讨了不同语言概念体系的异同,有助于在多语框架上做出更符合汉语特点的语义知识描写。
刘扬陆顾婧
关键词:词汇化
共1页<1>
聚类工具0