您的位置: 专家智库 > >

黄瑞红

作品数:7 被引量:79H指数:3
供职机构:中国科学院软件研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 4篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 2篇文化科学

主题

  • 4篇中文
  • 3篇信息处理
  • 3篇实体关系抽取
  • 3篇中文信息
  • 3篇中文信息处理
  • 3篇关系抽取
  • 3篇抽取
  • 2篇中文实体关系...
  • 2篇计算机
  • 2篇计算机应用
  • 1篇信息抽取
  • 1篇信息检索
  • 1篇页面
  • 1篇隐含
  • 1篇用户
  • 1篇用户模型
  • 1篇语言模型
  • 1篇输入法
  • 1篇随机场
  • 1篇条件随机场

机构

  • 7篇中国科学院软...
  • 1篇太原理工大学
  • 1篇中国科学院研...

作者

  • 7篇黄瑞红
  • 5篇孙乐
  • 4篇冯元勇
  • 2篇李文波
  • 1篇张俊林
  • 1篇毋建军
  • 1篇陈俊杰
  • 1篇董静
  • 1篇黄云平
  • 1篇张玮
  • 1篇张大鲲

传媒

  • 3篇中文信息学报
  • 1篇数字图书馆论...

年份

  • 2篇2008
  • 4篇2007
  • 1篇2006
7 条 记 录,以下是 1-7
排序方式:
中文实体关系抽取中的特征选择研究被引量:62
2007年
命名实体关系抽取是信息抽取研究领域中的重要研究课题之一。通过分析,本文提出将中文实体关系划分为:包含实体关系与非包含实体关系。针对同一种句法特征在识别它们时性能的明显差异,本文对这两种关系采用了不同的句法特征集,并提出了一些适合各自特点的新的句法特征。在CRF模型框架下,以ACE2007的语料作为实验数据,结果表明本文的划分方法和新特征有效的提高了汉语实体关系抽取任务的性能。
董静孙乐冯元勇黄瑞红
关键词:计算机应用中文信息处理实体关系抽取
词汇搭配和用户模型在拼音输入法中的应用被引量:6
2007年
中文输入法是中文信息处理的难题之一。随着互联网上中文用户的不断增加,中文输入法的重要性也变得日益突出。本文在对句子中长距离词汇依赖现象观察的基础上,抽取出语料库中的词汇搭配来获取长距离特征,并以此构建基于词汇搭配关系的拼音输入法系统;同时将词汇搭配的思想应用到拼音输入法的用户模型中,从而使我们的输入法系统能够辅助用户更加有效的输入。实验表明基于词汇搭配关系的改进方法对提高输入法的准确率有积极的作用。
张玮孙乐冯元勇李文波黄瑞红
关键词:中文信息处理中文输入法中文信息处理统计语言模型词汇搭配用户模型
亚洲语言信息检索评测会议NTCIR介绍被引量:2
2006年
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研艽领域。而跨语言信息检索评测是检索系统发展过程中非常重要的一环。NTCIR是针对亚洲语言的跨语言信息检索评测会议,本文介绍了NTCIR的发展历史,评测任务安排以及评测语料等有关信息。NTCIR已经成为相关研冤领域的著名国际会议,随着参赛队伍数目增加以及各种评测语料集合的逐步完善,可以预见它的影响将进一步扩大并对相关学科产生更加积极的影响。
张俊林黄瑞红孙乐
关键词:跨语言信息检索
基于核方法的中文实体关系抽取研究被引量:22
2008年
命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。
黄瑞红孙乐冯元勇黄云平
关键词:计算机应用中文信息处理中文实体关系抽取核方法复合核
基于Labeled-LDA模型的文本分类新算法
Latent Dirichlet Allocation(LDA)模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。通过在传统 LDA 模型中融入文本类别信息,本文提出了一种附加类别标签的 LDA 模型 (Lab...
李文波孙乐黄瑞红冯元勇张大鲲
关键词:文本分类图模型
文献传递
基于半马尔科夫条件随机场的命名体识别及其关系抽取研究
随着互联网和电子化办公的发展,出现了大量的文本资源。信息抽取技术可以帮助人们快速获取大规模文本中的有用信息。命名体识别与关系抽取是信息抽取的两个基本任务。本文在调研当前命名体识别和实体关系抽取中采用的主要方法的基础上,分...
黄瑞红
关键词:实体关系抽取信息抽取
基于topic的blog隐含社区发现
blog 使得人们进行情感交流、观点互动变得更为自由,在很大程度上增强了网络信息的互动性。有着共同兴趣或话题的 blog 之间通过紧密或松散的连接关系,形成独特的 blog 群体社区。当前的搜索引擎, 并不能通过关键词的...
陈俊杰毋建军黄瑞红
共1页<1>
聚类工具0