姜康
- 作品数:15 被引量:26H指数:2
- 供职机构:河海大学更多>>
- 发文基金:国家自然科学基金江苏省普通高校研究生科研创新计划项目江苏省科技支撑计划项目更多>>
- 相关领域:冶金工程自动化与计算机技术更多>>
- 基于Hadoop的水利元数据语义搜索方法被引量:2
- 2015年
- 为了解决水利领域中元数据搜索引擎缺乏语义理解,并且在集中式环境下索引水利元数据效率低下的问题,本文提出一种基于Hadoop的水利元数据语义搜索方法。首先结合本体与查询扩展技术的语义搜索方法,设计水利领域的本体推理规则、语义相似度计算方法、扩展词选择方法和语义相关度排序方法,从而有效地提高搜索结果的查全率与查准率;其次,针对XML形式的水利元数据建立索引的效率低下问题,引入Hadoop平台中的MapReduce并行处理模型,并行化处理解析提取元数据信息与索引建立工作,并修改SequenceFile的文件结构,以应对水利元数据的小文件问题,解决集中式环境下对水利元数据建立索引的性能瓶颈;最后利用Hadoop强大的并行计算能力,设计分布式环境下的语义扩展查询方法,从而提高水利元数据的查询效率。
- 冯钧李宗祥唐志贤姜康
- 关键词:领域本体语义搜索HADOOP
- 基于模糊优先级的二阶段实例层数据集成方法
- 本发明公开了一种基于模糊优先级的二阶段实例层数据集成方法,属于数据集成技术领域。所述二阶段实例层数据集成方法首先确定待集成记录所属分布式存储节点的优先级指标及每个指标的权重,并采用三角模糊数来表示模糊优先级;数据集成时,...
- 冯钧盛震宇唐志贤李士进朱跃龙万定生徐黎明冯读庆许潇姜康陈焕霖刘子源朱康康史涯晴
- 文献传递
- 基于序列相似性与频谱3-周期性的基因识别方法
- 本发明公开一种基于序列相似性与频谱3-周期性的基因识别方法,属于生物信息学中的基因识别领域。所述基因识别方法利用核苷酸频率特征矩阵来描述DNA序列;对不同序列通过计算核苷酸频率特征矩阵相似度来确定DNA序列的相似度,并根...
- 冯钧盛震宇陈焕霖金圣韬唐志贤朱跃龙万定生李士进徐黎明史涯晴许潇冯读庆朱康康姜康
- 文献传递
- 基于模糊优先级的二阶段实例层数据集成方法
- 本发明公开了一种基于模糊优先级的二阶段实例层数据集成方法,属于数据集成技术领域。所述二阶段实例层数据集成方法首先确定待集成记录所属分布式存储节点的优先级指标及每个指标的权重,并采用三角模糊数来表示模糊优先级;数据集成时,...
- 冯钧盛震宇唐志贤李士进朱跃龙万定生徐黎明冯读庆许潇姜康陈焕霖刘子源朱康康史涯晴
- 文献传递
- 一种基于云平台的元数据索引模型及方法
- 本发明公开一种基于云平台的元数据索引模型及方法,模型包括:全量索引模块,主要解决对遗留数据和迁移数据建立全量索引的问题;增量索引模块,主要解决审核通过的元数据以增量的方式加入索引库;索引管理模块,用于对索引的基本管理需求...
- 冯钧姜康唐志贤万定生朱跃龙李士进朱康康冯读庆许潇刘子源陈焕霖
- 文献传递
- 一种推断XML关键字查询目标节点类型的方法
- 本发明公开一种推断XML关键字查询目标节点类型的方法,在推测XML关键字查询的用户意图时,利用不同节点类型下关键字出现的频率以及节点类型的层次信息,赋予不同节点类型的查询相关度,同时结合目标节点类型应存在实例节点包含所有...
- 冯钧朱祖会唐志贤许潇徐黎明朱跃龙万定生李士进任锋盛震宇史涯晴冯读庆姜康陈焕霖朱康康刘子源
- 文献传递
- 一种基于客户端数量的数据片均分选择系统及方法
- 本发明公开一种基于客户端数量的数据片均分选择系统及方法,属于信息技术处理领域。系统包括服务器端、Tracker服务器和客户端。方法包括以下步骤:服务器端对数据进行编码形成种子文件,并解析种子文件连接到Tracker服务器...
- 冯钧胥世民唐志贤李士进朱跃龙万定生许潇徐黎明朱祖会冯读庆任锋盛震宇史涯晴姜康朱康康陈焕霖刘子源
- 文献传递
- 基于核苷酸位差的频谱3-周期性信噪比获取方法
- 本发明公开一种基于核苷酸位差的频谱3-周期性信噪比计算方法,属于生物信息学中的基因识别领域。所述信噪比计算方法首先要将DNA序列映射为4个指示序列,然后分别统计并记录4个指示序列里任意两个“1”出现位置之差,并把这些不同...
- 冯钧陈焕霖盛震宇金圣韬唐志贤朱跃龙李士进万定生徐黎明许潇冯读庆姜康朱康康史涯晴刘子源
- 文献传递
- 基于ElasticSearch的元数据搜索与共享平台被引量:24
- 2015年
- 随着水利行业信息化的发展,针对海量、多源、异构数据的共享与发现成为行业研究的热点。本文设计与实现一种基于Elastic Search的水利元数据搜索与共享平台,提出针对水利异构数据的解决方案并对海量数据建立索引,利用多租户访问控制策略,保证用户索引数据的一致性与安全性。通过Rest服务对索引资源进行封装,提供搜索与多粒度的共享方式。应用表明,平台能够保证用户准确高效地获得水利行业数据,节约了水利单位构建搜索系统的成本。
- 姜康冯钧唐志贤王超
- 关键词:元数据检索分布式
- 一种基于云计算的数据共享交换模型及方法
- 本发明公开一种基于云计算的数据共享交换模型及方法,模型包:数据共享服务模块,用以实现分布异构数据资源共享;数据交换服务模块,实现异构数据的交换功能;管理服务模块,用以实现共享交换和系统的管理;企业服务总线,实现服务注册与...
- 冯钧唐志贤朱跃龙万定生李士进许潇徐黎明史涯晴朱祖会任锋盛震宇冯读庆刘子源朱康康姜康陈焕霖
- 文献传递