张秀秀
- 作品数:10 被引量:98H指数:5
- 供职机构:中国科学院文献情报中心更多>>
- 发文基金:中国科学院国家科学图书馆度青年人才领域前沿项目中国科学院西部之光基金中国科学院知识创新工程青年人才领域前沿项目更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 元数据自动抽取研究新进展被引量:10
- 2008年
- 分析元数据自动抽取的现实需求,对元数据自动抽取的相关研究进行阐述,然后对DROID、NLNZ Metadata Extractor、Metadata Miner Catalogue PRO3种典型的元数据自动抽取器进行分析比较;在讨论目前元数据自动抽取技术局限性的基础上,对该技术进行总结和展望。
- 曾苏马建霞张秀秀
- 关键词:元数据自动抽取
- 元数据语义化映射过程研究——以中科院机构名称规范控制库为例被引量:5
- 2017年
- 元数据语义化映射是实现数据库或系统语义互操作的基础。文章结合元数据语义描述标准和元数据语义化映射方法,对元数据的语义映射过程进行分阶段描述,主要包括元数据集识别、数据元素分组和语义映射三个阶段。文章以中科院机构名称规范控制库的元数据语义化映射进行实证研究,佐证标准化的元数据语义映射过程对今后特定领域的信息资源共享和交换具有指导意义。
- 李慧佳马建玲张秀秀王楠
- 关键词:元数据语义化映射
- 关联数据集中开放资源的自动获取研究被引量:5
- 2015年
- 关联数据集中的开放资源是当前数字图书馆知识服务系统的重要登记对象和利用对象之一。通过调研分析关联数据集的资源内容类型和应用接口等特点,设计4个数据集遴选指标,归纳提出5种从关联数据集中获取开放资源的自动获取策略。同时,通过实验研究,对5种策略的优劣性进行了对比分析并给出了应用建议。
- 王思丽马建玲李慧佳王楠张秀秀
- 关键词:关联数据开放资源语义搜索
- PDF文件文本内容提取研究被引量:18
- 2008年
- 介绍了PDF的文件结构,在此基础上,给出了PDF文件的解析流程,以及从解析后的内容流中提取文本内容的方法。
- 张秀秀张立峰
- 关键词:PDF文本提取
- 基于CSpace的专题领域知识资源中心构建研究被引量:2
- 2017年
- 为快速构建面向特定领域的精准知识发现服务提供技术平台支撑,文章在对国内外专题知识资源建设现状和模式进行综合分析的基础上,研究探索基于CSpace构建专题领域知识资源中心的核心流程和方法体系,提出核心流程框架和每一流程的具体实现方法,并以全球变化知识资源中心建设为例,进行实证研究。该研究旨在打通专题领域知识资源从采集、加工、重组到存储、索引、展示到提供增值服务的整个流程,以形成规范化模式化的专题知识资源建设机制和可持续发展机制,但在高质量专题信息源的遴选和评价、可视化知识增值服务等方面仍需要深入研究。
- 王思丽马建玲马建玲刘巍张秀秀
- 关键词:机构知识库
- 语义Web模式下综合科技资源的关联策略研究被引量:3
- 2011年
- 在开发综合科技资源集成登记系统的实践基础上,研究综合科技资源的关联策略,针对其在语义化方面的局限性,提出一种利用D2RQ组件将综合科技资源的关系数据源公开为RDF接口,进而利用SPARQL端点查询技术将RDF接口公开为W eb服务的优化方案。试验证明,该方案合理可行,可为综合数字资源体系建设的未来发展提供思路。
- 王思丽马建霞祝忠明张秀秀马建玲
- 关键词:语义WEBRDFSPARQL
- PDF科技论文语义元数据的自动抽取研究被引量:10
- 2009年
- 在分析PDF文件结构的基础上,解析PDF文件的内容流,并采用基于规则的匹配方法和基于格式的定位方法,自动抽取科技论文中的语义元数据信息。实验结果表明,上述方法对标题、作者等重要的语义元数据信息能够达到较好的抽取效果。
- 张秀秀马建霞
- 关键词:PDF科技论文语义元数据自动抽取
- 国内外科学数据的组织与管理研究进展被引量:29
- 2013年
- 通过对现有研究文献的主题统计分析,发现国内外科学数据组织和管理的研究热点分布在科学数据的获取、共享、利用和评价4个方面。以这4个方面为主线对国内外科学数据的组织和管理研究进行梳理和分析,提出我国科学数据在政策保障机制、标准制定、数据服务等方面的发展建议。
- 李慧佳马建玲王楠王思丽张秀秀
- 关键词:科学数据数据共享
- 中文机构名称规范库建设的实践与分析——以“中科院机构名称规范库”建设为例被引量:14
- 2016年
- 由于体制改革更名和中西文名称的简写、缩写等原因,许多中文机构名称存在不统一和不规范表述的问题,这对这些机构相关资源、学术成果的定位检索、共享与统计将造成一定的影响。文章通过概述和分析"中科院机构名称规范库"建设的思路、内容与服务,认为我国的中文机构名称规范库建设应在规范控制的全面性、规范标准的制定、与前沿技术的融合及可持续性建设等方面予以重视与发展。
- 李慧佳马建玲张秀秀杨丽娜
- 关键词:关联数据知识资源
- 开放知识资源登记系统集成关联数据的方法及试验研究被引量:2
- 2016年
- [目的/意义]关联数据的可开放获取、学术资源丰富等特性为快速建立规范化的开放知识资源服务体系提供了重大契机,文章的研究旨在为相关开放资源登记类系统的未来发展提供理论基础。[方法/过程]文章以中国科学院开放知识资源登记系统为依托,重点研究并提出其集成关联数据的方法和技术,包括集成原则、简单集成方法和语义化集成方法等,并进行了相关试验研究。[结果/结论]能够实现将开放知识资源与关联数据进行语义化集成和关联发布。[局限]需要对关联数据和关联关系进行预处理;对集成后的关联数据的查询效率有待提高。
- 王思丽马建玲王楠李慧佳张秀秀
- 关键词:关联数据元数据语义集成