黄毅
- 作品数:7 被引量:17H指数:3
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家科技支撑计划更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 智能搜索引擎关键技术及应用研究被引量:6
- 2015年
- [目的 /意义]技术创新服务平台的建设中需要智能搜索引擎技术,智能搜索引擎技术的内涵或者说重点在于自动语义标注。技术创新服务平台上对搜索引擎的要求,与大众的搜索引擎的需求还是不同的,处理的对象主要是专业领域的文本,通过语义标注技术,能快速对企业文档进行语义化和结构化组织,从而为企业提供精准的知识服务。[方法 /过程]针对专业领域语义标注的相关问题,在进行深入研究与探讨的基础上,将语义标注理解为是对一组文档资源进行组织语义化的过程,提出利用结构化语义概念资源或集合对数字化文本进行自动标引的方法,并根据概念实体出现频次、位置和关系等因素,自动抽取相关语义概念集合,实现相关文本的语义内容的自动标注。[结果 /结论]评价语义标注相关实验的效果,展示语义标注的具体应用场景。同时,体现领域本体与语义标注语料不断更新、进化、形成互动的过程,旨在为专业领域的语义自动标注及智能搜索引擎的构建提供有益的参考。
- 刘耀郑德举潘希阳黄毅
- 关键词:语义标注自然语言处理搜索引擎
- 简报生成方法、装置、电子设备及计算机可读存储介质
- 本申请实施例涉及信息处理技术领域,公开了一种简报生成方法、装置、电子设备及计算机可读存储介质,其中,简报生成方法包括:确定待生成简报的文本的文本特征,并根据文本特征,通过概念词分类系统确定文本的各个概念词,以及通过概念词...
- 刘耀袁伟黄毅
- 文献传递
- 英语词句的存取装置方法和装置
- 提供了一种英语词句的存取方法和装置,其中,方法包括:向语料数据库中导入预设格式的英语词句;解析所述英语词句的概念和所述概念的属性,获取所述英语词句的语法规则;存储所述英语词句及所述英语词句的语法规则。在本发明提供的实施例...
- 刘耀乔晓东黄毅朱礼军
- 文献传递
- 基于领域本体的文本分割方法研究被引量:5
- 2018年
- 文本分割在信息检索、摘要生成、问答系统、信息抽取等领域发挥着重要作用。在总结现有的国内外文本分割方法的基础上,提出了一种基于领域本体对文本进行线性分割的方法。该方法利用初始概念自动获取结构化语义概念集合,并根据获取的概念、属性及属性词在文本中出现的频次、位置和关系等因素为段落赋予语义标签,挖掘文本的子主题信息,将拥有相同语义标注信息的段落划分为相同语义段落,实现了文本不同子主题之间的分割。实验结果表明,该方法对于特定领域的文本分割的准确率、召回率以及F值分别达到了85%,90%和88%,分割效果能够满足实际应用需求,并优于现有的无需训练语料的文本分割方法。
- 刘耀帅远华龚幸伟黄毅
- 关键词:文本分割领域本体语义标注
- 英语词句的存取装置方法和装置
- 提供了一种英语词句的存取方法和装置,其中,方法包括:向语料数据库中导入预设格式的英语词句;解析所述英语词句的概念和所述概念的属性,获取所述英语词句的语法规则;存储所述英语词句及所述英语词句的语法规则。在本发明提供的实施例...
- 刘耀乔晓东黄毅朱礼军
- 简报生成方法、装置、电子设备及计算机可读存储介质
- 本申请实施例涉及信息处理技术领域,公开了一种简报生成方法、装置、电子设备及计算机可读存储介质,其中,简报生成方法包括:确定待生成简报的文本的文本特征,并根据文本特征,通过概念词分类系统确定文本的各个概念词,以及通过概念词...
- 刘耀袁伟黄毅
- “面向众创的科技情报共享服务平台”建设研究被引量:6
- 2017年
- 针对科技情报(信息)存在的问题,提出基于国家工程技术图书馆的公益类馆藏资源和特色资源等整合各类数据库及资源,建设面向众创的科技情报共享服务平台,以推动实现科技资源综合利用、共享与合作。详细介绍了资源交换与统计、多源信息整合处理、一体化搜索引擎3个核心系统的建设情况,并分析总结了当前存在的问题与挑战,旨在为面向众创的科技情报共享服务平台的建设研究提供有益参考。
- 刘耀朱礼军黄毅
- 关键词:双创科技情报共享服务服务平台