侯永生
- 作品数:5 被引量:8H指数:2
- 供职机构:解放军信息工程大学信息工程学院更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 反馈式编译在循环级性能分析中的应用被引量:3
- 2011年
- 针对现有技术难以全面及精确地分析程序循环特性的不足,提出一种程序循环级性能分析的方法。该方法采用动态反馈的编译优化技术,并结合静态分析的部分方法,无需硬件架构的支持,适用范围广。测试结果证明该方法能够对程序的循环部分进行精确分析,帮助程序员找出循环级热点,辅助进行相应的手工优化。
- 郝云龙赵荣彩侯永生朱嘉风
- 关键词:反馈式编译性能分析
- 出口分支语句的向量化方法被引量:2
- 2011年
- 传统的向量化方法和超字并行方法依靠数据依赖关系分析确定程序中的并行性,而依赖关系分析无法处理非结构化控制流语句,现有的编译器对该类语句的向量化能力有限。为此,给出一种面向SIMD扩展体系结构的出口分支语句向量化方法,该方法针对一个向量因子内的出口分支语句,能够有效地进行自动向量化处理。测试结果表明,该方法既充分发掘了程序数据流中的并行性,又保证了控制流语义的正确性。
- 朱嘉风赵荣彩侯永生郝云龙
- 关键词:向量化非结构化
- 面向SIMD的数组重组和对齐优化被引量:3
- 2012年
- 随着多媒体应用的普及,越来越多的处理器集成了SIMD扩展,但是非连续或者非对齐访存会阻碍程序的向量化或者造成性能损失。针对实际应用中出现的数组引用不连续的情况,提出了一种数学模型,用以刻画数组的访存模式和数据重组方案,以判断这些数组引用是否可以通过数组转置的方法满足连续性要求;并采用过程间数组填充、循环剥离和基于SLP的向量化代码生成方法等进行对齐优化。最后基于SPEC2000测试集对该算法进行了测试,结果表明,该方法可以有效地提升向量化程序的执行效率。
- 魏帅赵荣彩姚远侯永生
- 关键词:SIMD数据重组
- 面向SIMD的数组重组和对齐优化
- 随着多媒体应用的普及,越来越多的处理器集成了SIMD扩展,但是非连续或者非对齐访存会阻碍程序的向量化或者造成性能损失。本文针对实际应用中出现的数组引用不连续的情况,提出了一种数学模型刻画数组的访存模式和数据重组方案,以判...
- 魏帅赵荣彩姚远侯永生
- 关键词:数据重组
- 自动向量化中基于数据依赖分析的循环分布算法
- 2011年
- 循环分布是开发向量化程序的一个有效的方法。但是由于程序中的数据相关性,当前的自动向量化编译器实现完全的循环分布非常困难。因此,当前的自动向量化编译器一般采用简单的循环分布方法。以数据依赖关系分析为基础,从有无依赖环的角度分析了程序中语句的向量化能力,提出了基于语句向量化识别的循环分布算法,并在自动向量化中加以实现。通过此方法,可以充分地分析语句或依赖环的向量化能力,最终采用循环分布,将可向量化的语句与不可向量化的语句分布在不同的循环中。该方法可以处理当前的自动向量化编译器无法向量化的循环,对一些语句间有依赖关系的循环可达到较好的效果。
- 黄磊姚远侯永生杨明
- 关键词:自动向量化SIMD