陈德训
- 作品数:72 被引量:30H指数:4
- 供职机构:江南计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划中央级公益性科研院所基本科研业务费专项资金项目国家科技重大专项更多>>
- 相关领域:自动化与计算机技术天文地球自然科学总论文化科学更多>>
- 波动方程叠前深度偏移技术及其应用被引量:1
- 2004年
- 简要介绍了波动方程叠前深度偏移技术的发展趋势,讨论了P道集波动方程速度分析技术,推导出了共方位角波动方程叠前深度偏移方法的计算公式。利用上述技术和方法,借助国产神威I型机,完成了埕北地区130km2三维地震资料的叠前深度偏移,实现了共方位角波动方程偏移算子的并行运算,并行效率达到了线性加速。偏移结果表明,此方法能有效改善地震数据的成象精度,适用于构造复杂地区。
- 孟祥宾杨淑卿徐兆涛胡中标陈德训王华忠
- 关键词:叠前深度偏移技术方位角地震数据地震勘探技术
- 众核实现的超越函数处理方法
- 本发明公开一种众核实现的超越函数处理方法,包括以下步骤:步骤1、通过一定的数学变换,将超越函数转换为常用的基本函数的复合运算实现;步骤2、利用数学函数的性质,将经过步骤1转换后的超越函数按照多项式的形式展开计算,获得相应...
- 刘鑫陈德训刘沙彭超陈龙得高捷周强
- 一种面向异构众核平台的Im2col加速方法
- 本发明公开一种面向异构众核平台的Im2col加速方法,C*H*W的张量经过Im2col变换后的矩阵形状为(C*Kh*Kw)*(Ho*Wo),其中C是通道数,H和W分别为输入的高度和宽度,Kh和Kw为卷积核大小,Ho和Wo...
- 黄则强刘沙刘鑫陈德训彭超高捷王宜鹏
- GRAPES_CUACE大气化学耦合模式并行优化被引量:1
- 2019年
- 文中主要介绍了数值天气预报模式GRAPES_MESO(4.0版本)与大气化学模式CUACE在线耦合形成的GRAPES_CUACE大气化学耦合模型在不同版本的x86体系结构下的并行优化算法的研究与分析。借鉴目前国内外主流的并行优化设计方法,结合GRAPES_MESO系统本身的程序架构和并行框架,针对不同版本x86体系架构做了相应的并行化改造。运用gprof工具和戳桩计时等方法,测试得到的程序热点模块主要有3部分:IO、通信和物理过程。对IO模块主要的优化方法为:1、由离散读写改为连续读写;2、开辟缓冲区由稀疏访存改为连续访存;3、异步IO。对通信部分采用两种方式:1、由细粒度改为粗粒度通信;2、采用时间复杂度更低的集合通信。对IO与通信模块优化结果分析可得:IO模块优化后的耗时占比由原来的43.7%降至1.41%,比重大幅度降低,最优部分性能提升了317倍,因此,该方法极大地提升了IO模块运行效率。此外,对物理过程进行优化采用的主要方法是:1、多层循环计算过程由离散改为连续;2、通信机制循环外移;3、数据复用以减少计算冗余;4、缩减栈变量空间等。这些优化方法使计算性能提高了22%,进一步提高了程序的并行效率和模式的强可扩展性。
- 叶跃进陈德训胡江凯马欣张小曳
- 关键词:粗粒度集合通信
- 面向异构众核架构的离散访存读写方法
- 本发明公开一种面向异构众核架构的离散访存读写方法,包括以下步骤:S1、将众核组共同组成一个存储块,将参与计算的物理量均匀分布在各计算核心的私有存储空间中,并通过建立索引关系可找到不同下标计算时数组的具体位置,再利用核间通...
- 李芳叶跃进陈德训刘鑫徐金秀孙唯哲陈鑫郭恒王臻
- 文献传递
- 一种面向云IDE的动态调度和用户认证方法
- 本发明公开一种面向云IDE的动态调度和用户认证方法,包括以下步骤:S1、用户在浏览器中输入统一登录地址和指定服务端口,输入用户名和口令;S2、Nginx服务将接收自S1的用户名和口令作为认证信息,对认证信息进行认证;S3...
- 陈华蓉陈德训孙川刘勇王敬宇冯赟龙彭达佳宋佳伟
- 文献传递
- 采用隐式求解的众核流水线并行方法
- 本发明提供了一种采用隐式求解的众核流水线并行方法,包括:在众核处理器的p个计算核心上将变量a<Sub>i,j</Sub>沿i方向划分数据,使得变量a<Sub>i,j</Sub>被分成p段,其中p为大于1的整数,而且将{a...
- 李芳刘鑫尉红梅孙唯哲陈德训
- 解决非结构网格离散访存问题众核并行优化算法
- 本发明公开一种解决非结构网格离散访存问题众核并行优化算法,包括以下步骤:S1、将网格单元周围的网格面通量数据分为若干数据块,并将不同数据块定义为不同属性;S2、将分块后的数据块并行拷入各个从核中;S3、各从核并行遍历拷入...
- 陈德训倪鸿刘鑫李芳孙唯哲郭恒何香
- 文献传递
- 非结构网格并行计算预处理方法研究被引量:5
- 2012年
- 非结构网格预处理方法是非结构网格CFD并行计算的关键技术之一。提出基于缓冲数据结构的快速搜索算法来建立全局网格单元邻接关系图,算法复杂度低,能够显著降低非结构网格预处理的存储需求;在提高核心计算访存命中率方面,提出网格单元重排序算法,该算法能够提高核心计算效率,并通用于各种非结构网格问题。实验结果表明,在用于大网格量的复杂计算区域时该非结构网格预处理技术仍能得到较理想的结果。
- 刘鑫陆林生陈德训
- 关键词:非结构网格预处理快速搜索
- 一种基于操作系统内核的量子计算资源管理方法
- 一种基于操作系统内核的量子计算资源管理方法,属于量子计算技术领域。本发明包括如下步骤:步骤1,解析当前量子计算任务所需的量子计算资源;步骤2,根据量子计算资源和当前系统中可用计算资源,给当前量子任务分配并映射相应的量子比...
- 郑岩邹通朱琪王星焱黄高阳林海南宓楠浣陈德训钱宇宋长明