丁锐
- 作品数:22 被引量:48H指数:4
- 供职机构:解放军信息工程大学更多>>
- 发文基金:国家科技重大专项国家高技术研究发展计划国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于Define-Use图的MPI通信求解算法
- 2012年
- 针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法。该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信。实验结果表明,将算法所得结果作为后端生成MPI通信代码的依据,可以有效减少通信量,加速比接近手工MPI并行程序。
- 赵捷赵荣彩丁锐陈达智
- 关键词:冗余通信MPI协议
- 分布存储结构的通信代码自动生成与优化
- 并行化编译技术是通过多种技术手段自动识别串行程序中潜在的并行性,并采用等价变换技术将串行程序转变为等价的高效并行程序的翻译技术。在并行化编译器中,代码生成属于编译器的后端,任务是根据并行识别和变换后的中间表示结果,自动生...
- 丁锐
- 关键词:代码生成通信优化
- 文献传递
- 基于循环分块的流水粒度优化算法被引量:1
- 2013年
- 当计算划分层迭代数目较大,或是循环体单次迭代工作量较大,但可用的并行线程数目较小时,传统的基于循环分块的流水粒度优化方法无法进行处理。为此,提出一种基于循环分块减小流水粒度的方法,并根据流水并行循环的代价模型实现最优流水粒度的求解,设计实现了一个流水计算粒度的优化算法。对有限差分松弛法(FDR)的波前循环和时域有限差分法(FDTD)中典型循环的测试表明,与传统的流水粒度选择方法相比,所提算法能够得到更优的循环分块大小。
- 刘晓娴赵荣彩丁锐李雁冰
- 关键词:自动并行化
- 自动并行化中不规则循环的通信代码生成
- 2014年
- 不规则计算在大规模并行应用中广泛存在。在面向分布存储结构的自动并行化过程中,较难在编译时为不规则循环生成并行代码。并行代码中的通信代码对程序运行结果的正确性以及加速效果有着严重的影响。通过分析程序的数组重分布图,使用部分冗余的通信方式来维持不规则数组访问的生产者-消费者关系,可以在编译时为一类常见的不规则循环自动生成有效的通信代码。该方法使用计算分解和数组引用的访问表达式求解不规则数组在各处理器的本地定义集作为通信的数据集,分析针对此类不规则循环划分的通信策略,继而生成相应的通信代码。实验测试的结果取得了预期的加速效果,验证了方法的有效性。
- 傅立国姚远丁锐
- 关键词:自动并行化
- 程序并行化中基于暴露集生成数据分布代码
- 2009年
- 在并行化编译中,代码生成属于编译器的后端,决定着并行程序的执行效率。数据划分将计算循环中被重定义或没被读引用的数据映射到处理器,按照数据划分生成通信代码会产生冗余通信。提出了利用数组数据流分析求解暴露集,并建立计算划分、循环迭代以及暴露集的不等式限制系统,最后通过FME(fourier Motzkin elimination)消元生成数据分布代码的优化算法。测试结果表明该算法对数据分布的优化效果明显。
- 丁锐赵荣彩韩林
- 关键词:代码生成通信优化
- 基于重排序变换和循环分布的通信优化算法被引量:1
- 2012年
- 针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优化算法。该算法根据给出的过程间副作用集合和基于mpi_wait/mpi_irecv移动的重排序变换规则,有序地采用重排序变换和循环分布,尽可能安全地扩大点到点非阻塞通信中通信与计算的重叠窗口,使MPI自动并行化编译器生成具有更多计算重叠通信的消息传递代码。实验结果表明,该算法能够隐藏更多的点到点非阻塞通信开销,并且明显提升消息传递程序的加速比。
- 陈达智赵荣彩韩林丁锐赵捷
- 关键词:通信优化并行化编译
- 一种面向划分的数组数据流分析方法
- 2014年
- 传统数组数据流分析方法主要针对精确依赖测试、数组私有化等研究,无法为划分提供数组在循环间详细的定义-引用信息.本文提出了一种面向划分的数组数据流分析方法,通过定义-引用图来表示数组的数据流信息.首先根据嵌套循环的并行性和结构特点,建立定义-引用图的结点集.然后基于活跃-引用和精确数据流分析,在循环内求出数组的定义、引用等数组区域.最后根据数据流方程和过程间分析添加定义-引用边.通过对矩阵求逆等七个实际用例的实验结果表明,定义-引用图的引用能够使划分算法对并行收益做出准确的评估,并减少了生成代码的通信冗余,提升了并行程序的加速比.
- 丁锐赵荣彩赵捷
- 关键词:自动并行化
- 基于二次规划模型的非线性下标表达式的依赖测试方法
- 本发明涉及一种分析程序指令之间依赖关系的方法,属于高性能计算中并行化编译优化技术领域,特别是涉及一种基于二次规划模型的非线性下标表达式的依赖测试方法,本发明针对传统依赖测试方法对非线性依赖测试的不足,通过对循环索引边界约...
- 单征庞建民姚远赵捷丁锐刘晓娴
- 文献传递
- 基于主导值的计算和数据自动划分算法被引量:5
- 2012年
- 计算和数据自动划分是并行化编译中一种自动分配计算和数据到各个处理机的优化技术,划分的结果直接影响程序并行的性能。数组是划分处理的主要对象之一,一些数组分布后的收益不高,但带来的并行约束却能对其它数组的划分产生干扰,导致大量数据重分布通信的产生。现有的划分算法中没有约定数组分布的优先次序,因此无法限制这些数组并行约束的传播,降低了优化编译器后端自动生成并行代码的性能。提出了一种基于主导值的计算和数据自动划分算法:将划分过程中数组对程序并行性的影响量化为主导值,并依据主导值的大小约定数组分布的优先次序,限制干扰数组并行约束的传播速度,提高划分结果的合理性。实验结果表明,算法能够获得良好的划分效果。
- 丁锐赵荣彩韩林
- 关键词:自动并行化数据分布
- 基于主导值的计算和数据自动划分算法
- 计算和数据自动划分是并行化编译中一种自动分配计算和数据到各个处理机的优化技术,划分的结果直接影响到程序并行的性能。数组是划分处理的主要对象之一,一些数组分布后的收益不高,但带来的并行约束却能对其它数组的划分产生干扰,导致...
- 丁锐赵荣彩韩林
- 关键词:数据分布并行化编译