洪学海 作品数:48 被引量:428 H指数:12 供职机构: 中国科学院计算技术研究所 更多>> 发文基金: 国家自然科学基金 中国工程院咨询项目 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 经济管理 政治法律 文化科学 更多>>
颠覆性信息技术发展及对科研信息化产生的影响 被引量:1 2018年 颠覆性技术是具有变革性意义的、会对已有技术产生创新性应用和颠覆性效果的技术。过去10年间,一些颠覆性技术已经对国家的科技创新、产业产生了巨大的能效。科学发现与研究的范式经过上千年的演进,共经历了四个阶段,分别是实验观察、理论分析、计算模拟和数据密集型科学研究。这四种范式的融合,共同成为现代科学研究方法的统一体。本文分析了五大类颠覆性信息技术的发展前景,阐述了颠覆性信息技术对计算机体系结构、大数据思维模式以及科研信息化的颠覆性影响。未来随着信息技术与信息化技术将不断发展,使得科研信息化基础设施将成为像水、电、气一样的便利的基础设施,可以随时随地、智能地满足科研人员开展科学研究的需求,人类和机器将会携手取得更加显著的科技突破。 汪洋 洪学海 孔丽华 郎杨琴 唐正正关键词:信息技术 科研信息化 信息化 基于任务资源需求预测的人工智能算力调度 2024年 为提升人工智能(AI)算力的任务执行效率和资源利用率,本文提出一种基于任务资源需求预测的AI算力调度方法,指导资源调度过程。相比于以往大多数研究工作仅围绕着图形处理器(GPU)资源设计的AI算力调度方法,本文充分考虑了多个维度资源对用户任务运行效率和计算集群资源利用的影响。本文基于机器学习方法构建任务资源需求预测模型,分析多维度资源对任务性能的影响,进而完成自适应资源伸缩调度,解决用户超额申请问题。实验结果表明,在相同时间内,该方法实现了更多任务的部署和执行。任务部署量提升25.3%,部署任务的完成率提升15.2%,GPU和内存利用率分别提升7.2%和8.0%,提升了算力资源的总体利用率。 杨明烜 洪学海 唐宏伟关键词:资源调度 数据质量 第8部分:信息和数据质量:概念和测量 本文件描述了信息和数据质量的基础概念,以及这些概念应用于质量管理过程和质量管理体系的方式。本文件还规定了在质量管理过程和质量管理体系中进行信息和数据质量测量的先决条件。 王志强 高焌峰 冯月贵 陶影海 金华松 庄莉 朱艳华 安小米 洪学海 郭加林 王会方 顾复 张伟群 杨青海 臧传胪 王彦军 洪岩 岳高峰 刘守华 徐凯程 尹书蕊基于局部优化的图表示学习增强 2023年 随着图表示学习在多个领域的成功应用,针对不同图数据和问题而设计的图表示学习方法爆发式增长.然而,图噪声的存在限制了图表示学习的能力.为有效降低图网络中的噪声比例,首先分析了图节点局部邻接的分布特性,并理论证明在局部邻接拓扑构建时,探索高阶邻近信息能够优化增强图表示学习的性能.其次,提出“2步骤”局部子图优化策略(local subgraph optimization strategy,LSOS).该策略首先根据原始图拓扑结构信息构造出具有多阶信息的局部邻接相似矩阵.然后基于相似矩阵和图节点局部信息,对图节点进行局部子图的结构优化.通过局部邻接的合理重构来降低网络中的噪声比例,进而达到图表示学习能力的增强.在节点分类、链接预测和社区发现3类任务的实验中,结果表明局部子图优化策略能够提升8个基线算法的性能.其中,在3个航空网络的节点分类任务中,提升效果最高分别达到23.11%,41.58%,24.16%. 唐正正 汪洋 洪学海 洪学海 姚铁锤 乔子越关键词:链接预测 图形化编程中模块间并行性的自动挖掘 被引量:2 2007年 在基于模块组合的图形化编程中,存在大量互不依赖的模块,这些模块具有并行执行的性质。翻译程序以拓扑排序算法遍历该有向无环图,为每个模块产生一个线程,为每条输入线产生一个信号量,以同步有依赖关系的模块的执行顺序,最终产生一个可并行执行的多线程程序,从而达到自动挖掘并行性、提高所生成程序的运行效率的目的。 尹华祥 丁玉磊 徐铸 洪学海 刘金刚 冯圣中 邱振戈关键词:图形化编程 多线程 并行性 网络失范行为治理的信息技术需求与挑战 被引量:4 2016年 不同于人类在现实社会中的行为,人类在网络空间的行为有其特殊性,比如借助符号而互动,很多时候匿名存在,甚至是虚假的身份,且不受地域的限制等等。因此,个人在现实社会的行为、道德约束等在网络空间社会相对得到"释放",网络空间也因此而产生了大量的失范行为,小到诈骗诽谤致使个人的财产名誉受损,大到商业机密窃取致使公司破产、煽动言论威胁国家安全, 范灵俊 洪学海 隋雪青 李国杰关键词:失范行为 信息技术 公司破产 商业机密 舆情分析 全景式大数据质量评估指标框架构建研究 2023年 大数据质量评估工作是促进数字经济、数字社会、数字政府高质量发展的重要保障.本研究针对当前大数据质量评估指标缺少标准化文件来源和全景式评估的相关问题,梳理出大数据质量评估的多种应用场景,以综合集成方法论为指导提出由“人理-事理-数理-机理”(HBDA)构成的全景式大数据质量评估视角.采用内容分析和编码方法,以大数据质量相关标准化文件丰富指标来源的代表性文献,经过3名研究人员的两轮筛选,构建出由56个指标构成的全景式大数据质量评估指标框架.采用案例研究法,开展B市国际大数据交易所、B市城市管理综合行政执法局和B市大数据中心三个实践案例研究,有效验证了该框架的正确性和可用性.所提出的HBDA视角下全景式大数据质量评估指标框架,拓展了全景式PAGE框架在大数据质量评估多场景中的应用;创新了大数据质量评估多维标准化协同的路径;对整体提升数字经济、数字社会和数字政府建设中的大数据质量具有战略意义,对增强数字国家的数据治理能力、大数据驱动的管理与决策能力具有指导意义. 安小米 黄婕 黄婕 许济沧 洪学海 王丽丽 洪学海大规模海洋数据同化的并行优化 被引量:3 2023年 海洋数据同化是一种同时利用海洋观测资料和海洋数值模式对海洋数据进行修正的有效方法,经过处理的海洋数据更加接近海洋的真实情况.在高分辨率下,基于中国科学院大气物理研究所(Institute of Atmospheric Physics,Chinese Academy of Sciences,IAP)和大气科学和地球流体力学数值模拟国家重点实验室(State Key Laboratory Modelling for Atmospheric Sciences and Geophysical Fluid Dynamics,LASG)发展的LASG/IAP气候系统海洋模式(LASG/IAP climate ocean model,LICOM)的同化并行程序往往涉及大量的文件读取、通信和计算,以往的研究虽然对这些方面进行了优化,但是由于优化只是停留在上层算法层面,没有考虑底层的文件系统以及超算集群的架构,因此优化的效果不太明显.针对以往研究存在的问题,进一步将海洋数据同化的数据特性、计算特性与所使用的超算平台的架构特性相结合,在此基础上结合时间局部性和空间局部性,提出了基于计算拓扑图的负载均衡策略、基于Lustre文件存储架构和超算集群特性的并行优化策略,以及计算、读取通信、写回3层重叠策略.最后,使用高分辨率数据集,在天河2号超算集群上对所提算法进行了测试.相比于现有算法,所提的算法在4 000核下对总体同化性能上提升了18倍.另外,还在曙光7 000超算集群上开展了测试.在4 000块DCU加速卡上,相比于已有算法,所提算法提升总体计算性能8倍左右. 蔡迪 洪学海 肖俊敏 谭光明关键词:数据同化 负载均衡 I/O优化 我国网络空间治理的挑战及对策 被引量:12 2017年 随着信息技术的发展和互联网的进一步普及,我国网络空间日趋庞大和复杂,而网络空间的治理却相对滞后:网络立法不够系统和全面,需要进一步完善,行业自律缺乏主动性和创造性,配合网络空间治理的信息技术工具体系尚未建立等,无法有效应对网络空间失范行为频发和泛滥的问题。随着《国家网络空间安全战略》的发布,网络空间治理进一步上升到国家战略层面,企业、社会组织和网民在网络空间治理中的地位得到肯定,构建以政府、企业、网民为主体的网络协同治理机制,完善立法、加强行业自律、建立信息技术工具体系,是我国当前应对网络空间治理的有效路径和可行方案。 范灵俊 周文清 洪学海关键词:网络空间 网络安全 协同治理 网络失范行为 关于规范大数据交易充分释放大数据价值的研究 被引量:19 2018年 分析了目前国内大数据交易普遍存在的交易额度低、质量低、层次低、风险高的"三低一高"现象,探讨了数据交易过程中存在"乱象""乱局"及"困局"的主要原因,从战略定位、优化治理、立法定规、市场机制等四个方面,提出了减少阻力、增强动力、建立数据交易良性动力机制的建议。 郭明军 安小米 洪学海关键词:大数据 动力机制