科技基础性工作专项(2013FY110900)
- 作品数:51 被引量:334H指数:12
- 相关作者:诸云强孙凯宋佳侯志伟罗侃更多>>
- 相关机构:中国科学院中国科学院大学山东理工大学更多>>
- 发文基金:科技基础性工作专项国家自然科学基金国家科技基础条件平台建设计划更多>>
- 相关领域:天文地球文化科学自动化与计算机技术经济管理更多>>
- 科学大数据集成共享进展及面临的挑战被引量:12
- 2017年
- 科学大数据集成共享既是数据密集型现代科学研究获取数据的重要途径,也是科学数据自身价值发掘和提升的必然选择,更是国家政策的顶层要求。在分析科学大数据内涵和特征的基础上,总结科学数据集成共享主要进展,指出科学大数据集成共享面临整合集成机制、集成共享质量控制、关联集成与语义搜索、数据产权与共享安全、数据高效利用等5个方面的问题并分别提出应对策略。
- 诸云强潘鹏潘鹏孙凯石蕾孙凯
- 关键词:数据共享数据质量
- 科技基础性工作数据资料的汇交与整编被引量:9
- 2017年
- 国家科技计划项目数据资料汇交与规范化整编对于促进数据的开放共享,发挥数据资源的最大价值,实现国家科技投入的最大效益具有重要意义。科技基础性工作专项是国家科技计划的重要组成部分,其数据资料尚未得到有效的汇交与规范化整编。基于此,本文首先研究科技基础性工作专项项目数据资料汇交与规范化整编的总体流程,然后论述了数据汇交和规范化整编的具体内容和实施步骤,最后开展了数据资料汇交与规范化整编实践。本文的研究思路对于国家各级科技计划项目数据资料的汇交与规范化整编具有重要的参考意义。
- 诸云强孙凯孙凯王筱萱杨雅萍朱华忠乐夏芳朱华忠宋佳彭克银何明跃陈佑启彭克银付磊杨彦臣杨眉邹金秋陈艳李金斌刘燕张金区
- 关键词:科技基础性工作汇交数据共享
- 时间本体及其在地学数据检索中的应用被引量:26
- 2015年
- 高效、准确地获取目标数据及其关联数据,是决定大数据共享与挖掘分析能否实现的关键因素。传统的数据检索方法无法利用地学数据间的显性或隐含关系,已不能满足日益增长的对检索结果质和量的需求,而本体理论和技术的语义检索成为当前的研究热点。本文针对时间这一地学数据的本质属性,在系统研究地学数据时间概念与特征的基础上,建立了地学数据时间本体模型,并深入论述了模型中的时间关系、时间坐标系等内容,提出了时间位置和时间距离的描述函数,同时研究了二者的本体表达方式。构建了包括地质年代等在内的地学数据时间本体库,并以语义网开发框架Jena为基础,经本体解析、元数据时间信息抽取与标注等过程,将时间本体应用于地球系统科学数据共享平台的元数据检索之中。结果表明,以时间本体的地学数据语义检索查全率约为关键字方法的1倍,检索结果排序,以及关联数据推荐方面也有更好的效果,为促进地学数据共享与关联发现提供了一种有效的方法。
- 侯志伟诸云强高星潘鹏罗侃王东旭
- 关键词:地学数据语义检索
- 2006—2015年生物资源考察与调查时空分布特征研究
- 2017年
- 生物资源科学考察与调查是我国科技基础性工作专项中开展的重要工作之一,2006年以来部署了众多涵盖生物资源科学考察与调查的项目,但目前缺少对已开展的生物资源考察内容、类型、范围的时空分布特征等进行全面系统的梳理。本文总结了2006—2015年度国家科技基础性工作专项中的生物资源科学考察与调查的项目数量、调查内容等,并结合GIS技术分析了其时空分布特征。分析表明:第一,近年来生物资源科学考察次数明显增多,空间上分布也非常广泛;第二,目前科技基础性工作专项中开展的生物资源科学考察与调查存在部分物种和典型区域数据急需补充更新的问题;第三,空间尺度上仍存在部分考察空白区域;第四,对生态环境脆弱区生物资源考察以及对个别濒危物种考察的重视程度较为单薄。
- 张心萍王宏智杨雅萍
- 关键词:生物资源GIS技术
- 基于BP神经网络的马铃薯遥感识别图像数据分析研究被引量:3
- 2017年
- 运用遥感手段精确监测马铃薯种植面积是稳固马铃薯主粮化政策、维护国家粮食安全的必要保障。本文以吉林省长春市九台区纪家镇、兴隆镇为研究区,选用landsat8 OLI遥感数据,借助ENVI平台构建了基于BP神经网络的土地覆盖分类模型,应用于研究区的马铃薯等作物分类研究。以landsat8 OLI7个彩色波段作为输入,不断调节分类参数,最终确定了最优分类网络结构。结果显示,BP神经网络法马铃薯的分类生产者精度为94.22%。研究表明,BP神经网络分类方法是一种手段灵活、结果较准确的马铃薯遥感识别方法。
- 周扬帆陈佑启邹金秋何英彬
- 关键词:BP神经网络马铃薯遥感影像遥感数据
- 国外公开乳腺影像数据集的现状分析及其启示被引量:5
- 2021年
- 随着医疗人工智能的热潮,利用计算机视觉技术研究医学影像,有效地帮助医生进行疾病的识别与筛查已成为研究者们的重点关注目标。本文以国外乳腺影像数据集的研究为例,对国外大型公开乳腺影像数据集的数据集基本情况、数据具体信息、国外使用数据的相关研究以及共享利用的途径进行概述。在此基础上,综合分析国外公开乳腺影像数据集的特点,结合我国医疗健康数据开放现状,阐述国外公开影像数据集对我国医疗健康数据开放的启示。
- 茅枫张燕娜刘乾宇闫思桃胡倩罗妍李金斌付磊
- 关键词:乳腺癌医学影像
- 地学数据本体支持下的科学数据集成方法被引量:3
- 2017年
- 科学数据的语义异构是数据集成共享的主要瓶颈。数据本体是解决数据语义异构的有效方法。首先在系统分析地学数据特征的基础上,提出地学数据本体的总体架构,重点研究地学数据本质内容本体和形态本体,并构建了地学数据本体库。进一步结合科学数据集成的需求,提出基于地学数据本体的数据集成总体流程。在此基础上,以科技基础性工作专项产出的科学数据为例,开展地学数据本体支持下的科学数据集成方法应用研究,证明本方法的可行性和有效性。
- 孙凯贾萍贾萍诸云强诸云强侯志伟王筱萱
- 关键词:语义异构科学数据数据集成映射关系
- 基本比例尺地形图瓦片生产中的接边研究被引量:1
- 2014年
- 通过分析基本比例尺地形图瓦片生产中的接边特点和Global Mapper应用方式,对数字化接边检查方式进行了研究,并阐述了实现原理,总结了完整的检查方案。经试验验证,该方式适用于大规模接边和查图,将无纸化办公在制图领域进行了扩展。
- 霍超刘颖真史克农范承啸
- 关键词:GLOBALMAPPER
- 地理空间模型自动数据匹配结果精准表达方法被引量:6
- 2018年
- 随着现代地学研究的深入与交叉融合,地理空间模型变得日益复杂,需要的输入数据也越来越多。为了快速、高效准备输入数据,一种有效的方法就是为模型自动匹配网络上已经共享的数据。在此背景下,本文针对不完全匹配数据需要自动转换处理的需求,开展了匹配结果精准表达方法研究。首先分析了自动数据匹配流程,在此基础上,提出了匹配结果精准表达结构及其形式化方法。匹配结果包含数据内容、空间和时间3个本质特征项,以及数据类型、格式和结构等形态特征项,每个特征项通过基于XML的相似度、匹配关系、匹配范围分别对共享数据与模型输入数据是否一致、差异在哪、差异有多大等问题进行精准的形式化表达。如果某一数据特征项相似度为1或本质特征项相似度为0时,意味着该特征项完全满足或完全不满足模型的需求,则没有必要进一步精准表达匹配结果;否则需要按上述方法对该数据特征项的匹配结果进行精准的形式化表达。湖南省2010年土壤生产潜力计算实践表明,本文方法可以为后继数据处理服务的自动组合及其数据的自动处理,以及最终向模型推荐完全符合需求的数据奠定基础。
- 杨杰诸云强宋佳宋佳孙凯陆锋
- 关键词:数据共享语义关系
- 面向空间大数据的分布式存储策略被引量:8
- 2019年
- 云计算、物联网、互联网等的发展使社会进入了大数据时代,空间大数据是大数据的主体数据集之一,在国民经济和社会各领域应用广泛。空间大数据要发挥价值就需要在数据共享上做出突破,因此将空间大数据进行有效存储和管理是数据共享及利用所目前面临的问题。通过分析比较目前大数据存储的主要技术,提出了一种基于iSCSI技术的分布式数据库和分布式文件系统相结合的空间大数据存储策略。采用iSCSI技术构建分布式Oracel RAC,完成对空间大数据中的矢量数据、影像和其他数据索引的存储。结合工作实践将这种存储策略应用到空间大数据管理中,验证了该策略的可靠性和可行性,对空间大数据的管理及应用有一定的参考价值。
- 唐桂文韩嘉福李洪省
- 关键词:分布式文件系统分布式数据库