国家科技重大专项(2012ZX10002010-002)
- 作品数:2 被引量:4H指数:2
- 相关作者:刘逸敏更多>>
- 相关机构:第二军医大学更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:医药卫生自动化与计算机技术更多>>
- 利用大数据开源项目实现医疗临床大数据筛选被引量:2
- 2018年
- 目的:用大数据技术,实现对复杂类型数据即席查询、文本搜索处理的临床大数据筛选和分析平台。方法:应用基于Hadoop的文件分布存储(HDFS)、大数据仓库(Hive)、数据抽取技术(Sqoop)以及分布式文本搜索(Solr)大数据开源项目,实现对临床大数据的分布存储管理、即席查询、筛选规则加载和病历文本分析。结果:按照"Bolondi再分期模型对肝切除术后患者总体生存预测"课题的数据筛选要求,平台能帮助研究者从大量的具有复杂结构的临床数据中获取符合规则的样本数据。结论:融合应用大数据开源项目是海量医疗临床数据筛选和分析的有效技术方法。
- 陈军晓汤其宇刘逸敏
- 关键词:大数据数据筛选HADOOPSOLR
- 一种以电子病历为核心的多数据库数据集成方法被引量:2
- 2013年
- 介绍了一种以电子病历(EMR)为数据核心,并融合了个性化治疗资源库的数据集成方法。该方法整合了多数据格式的临床数据集,如电子病历、抗生素知识库、随访数据库、肿瘤患者标本库和基因治疗数据库。数据集成目的是用于归纳与分类疾病的诊断,分析与对比治疗前后的临床效果,并预测和挖掘疾病治疗的路径。分析了两种常用数据格式的数据抽取与集成性能,提出了以下要求:数据集成方法要满足对多数据格式抽取的要求,以适应不同医疗数据资源的整合;数据集成是在多数据源的大数据环境下工作,所以集成方法须对数据的抽取速度性能作压力测试;数据集成是数据读入并写入目标数据库的过程,因此集成方法中要包含能灵活定义、易于调整、隐私数据查询安全的抽取规则组件,以及清晰友好的集成查询界面。最后通过3组实验,说明了基于EMR的集成架构和方法能解决多种数据格式的临床数据集成问题;利用MyBatis组件完成了源数据库表与抽取规则的映射工作,过滤了集成过程中的隐私数据;使用SilverLight组件的WEB呈现技术,给用户提供了友好便捷的数据查询平台。目前该数据集成方式已应用在国家重大专项—肝肿瘤样本库专题下7个分中心的临床数据集成工作。
- 刘逸敏高幼骏王新宁杨帆魏明月沈宗春
- 关键词:电子病历数据集成