刘鑫
- 作品数:78 被引量:71H指数:5
- 供职机构:江南计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家攀登计划更多>>
- 相关领域:自动化与计算机技术理学电子电信航空宇航科学技术更多>>
- 众核实现的超越函数处理方法
- 本发明公开一种众核实现的超越函数处理方法,包括以下步骤:步骤1、通过一定的数学变换,将超越函数转换为常用的基本函数的复合运算实现;步骤2、利用数学函数的性质,将经过步骤1转换后的超越函数按照多项式的形式展开计算,获得相应...
- 刘鑫陈德训刘沙彭超陈龙得高捷周强
- 一种面向异构众核平台的Im2col加速方法
- 本发明公开一种面向异构众核平台的Im2col加速方法,C*H*W的张量经过Im2col变换后的矩阵形状为(C*Kh*Kw)*(Ho*Wo),其中C是通道数,H和W分别为输入的高度和宽度,Kh和Kw为卷积核大小,Ho和Wo...
- 黄则强刘沙刘鑫陈德训彭超高捷王宜鹏
- 面向异构众核架构的离散访存读写方法
- 本发明公开一种面向异构众核架构的离散访存读写方法,包括以下步骤:S1、将众核组共同组成一个存储块,将参与计算的物理量均匀分布在各计算核心的私有存储空间中,并通过建立索引关系可找到不同下标计算时数组的具体位置,再利用核间通...
- 李芳叶跃进陈德训刘鑫徐金秀孙唯哲陈鑫郭恒王臻
- 文献传递
- 海量数据驱动下的高分辨率海洋数值模式发展与展望被引量:9
- 2019年
- 海洋数值模式是定量描述海洋物理现象及其变化的数值模型,也是海洋与气候研究、预测的核心工具。随着海洋观测的不断投入与积累、对海洋认识的不断深入,特别是在高性能计算技术的支撑下,海洋数值模式已有了长足进步,正朝着高分辨率和多物理过程的方向发展。随着分辨率的提高、物理过程的细化,海洋数值模式的发展面临着多个方面的挑战。当前,海洋数据数量和种类不断增多,同时超级计算机、高性能计算和深度学习等技术的快速发展,为海洋数值模式的突破提供了机遇与挑战。本研究回顾了海洋数值模式的发展现状,梳理和分析了其发展中遇到的大规模高效并行计算和参数优化这两个关键问题,探讨和展望了当前海量数据驱动下海洋数值模式的发展趋势。提出计算负载均衡、计算与I/O重叠的并行流水线设计以及降低全局交换的算法改进是当前突破高分辨率海洋模式大规模高效并行效率的关键。从海洋科学、高性能计算以及深度学习深度交叉融合的角度,提出了实现海洋科学与深度学习相结合的6个途径,在此基础上,探讨了基于深度学习的参数化优化可能实现的途径。
- 宋振亚刘卫国刘鑫苏天赟刘海行尹训强
- 关键词:海量数据高分辨率
- 求解化学非平衡NS方程组的隐式R-K方法及其并行实现
- 2011年
- 建立一种求解非定常化学非平衡NS(Navier-Stokes)方程组的空间全隐式R-K(Runge-Kutta)方法,给出并行程序框架,讨论多块网格预处理技术和通信优化技术。在神威集群上进行算例考核,验算了算法的可行性、正确性和较高的并行效率。
- 李芳刘鑫张娟陆林生
- 关键词:化学非平衡隐式RUNGE-KUTTA方法
- 一种通用高效的重叠网格“挖洞”算法
- 2007年
- 研究了建立重叠包络面和中空(非计算区域)包络面的鲁棒性方法,并提出了迷路算法应用于确定重叠包络面内外点,为重叠网格提供了高效、可靠、通用的"挖洞"算法,该算法复杂度低、实现简单、健壮性较好。实验结果表明,对于大网格量的复杂计算区域问题,该算法仍能得到较理想的效率。
- 刘鑫陆林生
- 关键词:重叠网格
- 基于指令序列与消息序列指引的深度依赖问题并行方法
- 本发明公开一种基于指令序列与消息序列指引的深度依赖问题并行方法,包括以下步骤:S1、将解向量按块进行平均划分,通过这种划分将解向量中各元素之间的依赖性转换成向量块之间的依赖性;S2、将一个向量块完成计算称为一次更新操作,...
- 陈鑫陈德训刘鑫李芳徐金秀孙唯哲郭恒王臻
- 文献传递
- 并行求解多维递归方程组的三种Krylov子空间迭代方法
- 2012年
- 多维递归方程组在并行求解时存在串并行不一致问题,提供三种Krylov子空间迭代求解方法——PCG/ATCG和GMRES来解决这一问题,并采用典型算例对这三种Krylov子空间迭代方法进行正确性验证和加速比测试。试验表明这三种Krylov子空间迭代法在并行规模较大的情况下,均能够正确求解多维递归方程组,并且加速特性良好。
- 李芳尹万旺刘鑫陆林生
- 关键词:PCGGMRES
- 一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法
- 本发明公开一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法,包括以下步骤:S1、ONNX文件向Caffe2文件的映射,得到Caffe2格式的前向传播网络,S2、根据S1中获得的前向传播网络的信息,自动生成求...
- 彭超刘鑫刘沙陈德训黄则强高捷王宜鹏
- 基于控制约束的访存测试程序生成方法
- 本发明公开一种基于控制约束的访存测试程序生成方法,包括以下步骤:步骤1、生成控制核心运行的程序,在其中声明可操作的地址空间大小以及首地址,并生成计算核心的代码段;步骤2、生成计算核心访存测试程序,将计算核心的访存首地址设...
- 谭坚刘鑫陈德训胡夏晖武颖颖相陈伟陈明津
- 文献传递