您的位置: 专家智库 > >

国家科技支撑计划(2006BAH03805)

作品数:11 被引量:69H指数:4
相关作者:张智雄吴思竹徐健刘建华洪娜更多>>
相关机构:中国科学院中国科学院研究生院中国科学技术信息研究所更多>>
发文基金:国家科技支撑计划国家自然科学基金更多>>
相关领域:文化科学理学经济管理自动化与计算机技术更多>>

文献类型

  • 11篇中文期刊文章

领域

  • 9篇文化科学
  • 1篇经济管理
  • 1篇自动化与计算...
  • 1篇理学

主题

  • 5篇知识抽取
  • 5篇数字图
  • 5篇数字图书馆
  • 5篇图书
  • 5篇图书馆
  • 5篇抽取
  • 3篇网络
  • 2篇知识库
  • 2篇数据挖掘
  • 2篇网络资源
  • 2篇可视化
  • 2篇关系抽取
  • 1篇动态监测
  • 1篇对象抽取
  • 1篇信息可视化
  • 1篇性能对比
  • 1篇医学数据
  • 1篇医学数据挖掘
  • 1篇语义检索
  • 1篇知识库构建

机构

  • 8篇中国科学院
  • 7篇中国科学院研...
  • 3篇中国科学技术...
  • 2篇中山大学
  • 1篇北京邮电大学
  • 1篇北京大学
  • 1篇北京师范大学

作者

  • 8篇张智雄
  • 2篇洪娜
  • 2篇刘建华
  • 2篇吴思竹
  • 2篇徐健
  • 1篇邢美凤
  • 1篇乔晓东
  • 1篇吴振新
  • 1篇吴斌
  • 1篇武夷山
  • 1篇殷蜀梅
  • 1篇张兆锋
  • 1篇朱礼军
  • 1篇许德山
  • 1篇俞立平
  • 1篇张志平
  • 1篇潘云涛
  • 1篇赵琦
  • 1篇李峰
  • 1篇胡长爱

传媒

  • 6篇数字图书馆论...
  • 3篇情报理论与实...
  • 2篇情报学报

年份

  • 2篇2011
  • 3篇2010
  • 5篇2008
  • 1篇2007
11 条 记 录,以下是 1-10
排序方式:
科研机构动态监测的网络资源重要性排序方法研究被引量:1
2011年
在科研机构动态监测的需求推动下,提出一种利用科技敏感词表并结合网络资源属性、主题内容、链接文本、锚文本、来源目录等多项指标,对采集自科研机构的网络资源进行重要性排序的方法。提出网络资源重要性排序的研究框架及流程,利用实时采集的数据进行实验分析,最后给出研究结论及下一步工作。
吴思竹张智雄李峰
关键词:网络资源
基于网页特征识别的噪音网页过滤方法研究被引量:4
2011年
本文通过对网页结构和内容特征的深入分析和识别,对噪音网页的过滤方法进行研究和实验。首先利用阈值过滤具有明显特征的噪音网页,而后建立网页特征向量,利用SVM对网页进行分类。采用采集自Web的网页数据进行实验分析,最后得出研究结论,并展望下一步工作。
吴思竹张智雄
关键词:网络资源
非结构化文本中内容对象抽取的技术方法综述被引量:1
2008年
近年来,知识抽取技术在非结构化文本的处理中起到很重要的作用.文章在对当前知识抽取的相关文献、系统和项目分析研究的基础之上,提出了当前知识抽取研究中的主要抽取内容对象的分类,并对这些主要内容对象抽取的相关技术方法进行综述.主要总结了Web对象识别和集成、术语识别和抽取、主题发现和识别、概念层次关系的抽取、非概念层次关系的抽取、事实抽取、观点抽取和倾向识别等7种内容对象抽取的技术方法.并在此基础之上,对未来知识抽取的发展趋势进行了分析.该文为2008年第9期本期话题'知识抽取'的文章之一.
张智雄吴振新赵琦洪娜徐健刘建华
关键词:知识抽取术语抽取主题发现关系抽取数字图书馆
典型关系抽取系统的技术方法解析被引量:3
2008年
实体关系抽取是信息抽取领域中的一项重要任务.文章在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:以模式构造和匹配为主线进行关系抽取、以词典驱动关系抽取、运用机器学习算法进行关系抽取、借助Ontology进行关系抽取以及多种方法有机结合进行关系抽取.从技术应用特点、核心模块的实现细节以及系统评测结果等方面深入分析了典型的关系抽取系统,它们包括EEES关系抽取系统、SVM关系抽取系统、T-Rex关系抽取系统、KMI语义网络门户的混合关系抽取系统,旨在为进一步构建实体关系抽取系统提供良好借鉴.该文为2008年第9期本期话题'知识抽取'的文章之一.
徐健张智雄
关键词:知识抽取关系抽取数字图书馆
基于Ontology的大规模知识库构建技术分析
2008年
基于Ontology的大规模知识库系统是语义内容应用的基础.文章介绍了四个有代表性的基于Ontology的大规模知识库系统,分别分析了系统的关键技术、特点和性能,并对它们的性能进行了对比分析,最后分析了当前系统的局限、挑战和趋势,以期对国内数字图书馆知识库建设有所帮助.该文为2008年第9期本期话题'知识抽取'的文章之一.
洪娜张智雄
关键词:知识抽取知识库性能对比数字图书馆
GATE系统关键组件的应用开发接口研究和应用被引量:2
2008年
近年来,谢菲尔德大学研究开发的GATE(General Architecture for Text Engineering,文本工程通用框架)不断发布新版本的同时,在科研、教育、商业等领域获得广泛应用.文章从GATE基本架构入手,分析GATE关键组件,结合开发实例研究GATE主要接口应用开发方法,并探讨了Gazetteer和JAPE等资源的扩展方法,为基于GATE更深层次的应用提供基础.在研究其应用开发接口基础上,文章进一步展示了基于GATE扩展的知识抽取系统的应用实例.该文为2008年第9期本期话题'知识抽取'的文章之一.
刘建华张智雄
关键词:知识抽取GATECREOLE知识抽取数字图书馆
医学文献集合的主题抽取和主题聚类实践被引量:4
2008年
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题'知识抽取'的文章之一.
殷蜀梅张智雄
关键词:知识抽取主题抽取文本挖掘医学数据挖掘数字图书馆
面向本体知识库的可视化检索研究被引量:8
2010年
可视化检索技术是图形生成和语义检索相结合的一种新技术。本文探讨了信息可视化的主要方法,介绍了领域本体知识库的内部结构,重点说明可视化检索的实现思路以及可视化平台的功能设计,提出了后期的研究要点。
许德山张智雄邢美凤
关键词:语义检索本体知识库可视化
信息可视化在科技文献深度挖掘中的应用被引量:18
2007年
信息可视化是常用的数据挖掘方法之一,它通过把海量的数据转化成可视化的形式让人们更容易观察、浏览和理解信息,并且找到数据中隐藏的模式。目前,国家已经建立海量的科技文献资源,但仅限于查询、浏览、全文传递等服务,没有得到充分的开发利用。本文介绍了利用信息可视化技术科技文献资源进行深度挖掘的方法,并介绍了一种监测模型CiteSpaceⅡ,它可以对科技文献中涌现的趋势和临时模式进行监测和可视化。最后总结出了利用信息可视化技术对科技文献资源进行深度挖掘的一般步骤和常用的开发工具。
张兆锋张志平乔晓东吴斌
关键词:信息可视化数据挖掘
基于结构方程的学术期刊评价研究被引量:20
2010年
本文利用中国科学技术信息研究所医学学术期刊数据,将指标分为影响力、时效性、期刊特征三个一级指标,它们之间存在两两相关关系,在此基础上建立结构方程进行模拟,计算出3个一级指标值并采用主观赋权法进行期刊的综合评价,取得了较好的结果。结构方程通过模拟期刊指标之间错综复杂的关系,可以对一些隐含指标进行估计,还可以进行指标的筛选,为科技评价提供了一种新的思路。同时要注意的是,基础数据的完备性和模型建立的科学性对评价结果的影响很大。
俞立平潘云涛武夷山
关键词:结构方程模型
共2页<12>
聚类工具0