车永刚
- 作品数:80 被引量:83H指数:5
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术理学航空宇航科学技术电子电信更多>>
- 一种串行与并行模拟相结合的并行计算机系统性能模拟方法
- 本发明公开了一种串行与并行模拟相结合的并行计算机系统性能模拟方法,要解决的技术问题是提高性能模拟准确性和模拟效率。技术方案是先从并行源程序中分离计算代码段,将各计算机代码段封装为可独立执行的串行源程序;接着对串行源程序进...
- 车永刚徐传福王勇献王正华彭宇行陆平静方建滨翁玉芬
- 文献传递
- 基于流处理的生物序列数据库搜索多层次加速方法
- 本发明公开了一种基于流处理的生物序列数据库搜索多层次加速方法,目的是在保证搜索准确性、较低成本的前提下,加快生物序列数据库搜索速度。技术方案是先构建由多台个人计算机组成的集群系统,指定一个主控节点机器;主控节点机器将数据...
- 王勇献王正华董蕴源车永刚徐传福彭宇行王意洁邢座程
- 文献传递
- 超级计算机体系结构及应用情况被引量:4
- 2003年
- 本文概述了当今超级计算机体系结构类型及特点,考察了国外超级计算机在气象、核模拟、CFD、生物信息学和医学、天体物理学等典型应用领域的应用情况,分析了超级计算机体系结构与应用领域之间的关系。
- 车永刚柳佳王正华李晓梅
- 关键词:超级计算机体系结构
- Intel多核与集成众核上CFD程序的OpenMP性能分析被引量:2
- 2015年
- 多核与众核已成为当前主流的高性能计算体系结构,Open MP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研究了其在Intel Xeon E5 Sandy Bridge多核处理器和Intel Knights Corner集成众核协处理器上的Open MP性能。重点分析了Open MP库开销、线程负载均衡性、主存访问带宽对性能的影响,发现因Open MP并行引入的冗余计算对并行效率影响很小,但串行计算部分和负载不均衡性对并行效率影响大,主存访问带宽对浮点性能的影响大。还比较了该程序两种体系结构上的性能差异,讨论了性能进一步优化的方向。
- 车永刚张理论王勇献徐传福程兴华
- 关键词:多核OPENMP性能分析
- 结合模型和迭代编译优化矩阵相乘程序
- 高性能计算应用程序获得的持续性能与机器峰值性能的差距日益扩大,很大程度上制约着高性能计算的发展。程序变换通过对程序进行适应机器体系结构特征的优化变换,提高程序实际执行性能,是解决该问题的有效途径之一。很多高级程序变换均具...
- 陆平静王正华车永刚
- 关键词:遗传算法
- 文献传递
- 基于Trace的并行性能模拟任务映射方法
- 2010年
- 针对Trace驱动的并行性能模拟问题,提出基于Trace信息指导的映射方法CO-LP3M。CO-LP3M利用从Trace中提取的目标应用程序的通信特征,以宿主机物理进程间通信次数最小化为目标,兼顾计算负载均衡,生成并行模拟任务到宿主机的映射。对HPL程序进行实验,结果表明CO-LP3M可有效提高并行模拟性能,相对于常见的映射方式,模拟性能最多提高14.7%。在此基础上给出CO-LP3M的扩展技术SCO-LP3M。
- 方建滨徐传福车永刚翁玉芬王正华
- 关键词:任务映射通信优化负载平衡
- 基于OpenMP4.0的发动机燃烧模拟软件异构并行优化被引量:2
- 2018年
- LESAP是一个超燃冲压发动机燃烧数值模拟软件,可模拟发动机燃烧室内的燃烧化学反应与超声速流动,具有实际工程应用价值,其计算量巨大.面向通用CPU与Intel集成众核协处理器(many integrated core,MIC)构成的新型异构众核平台,使用新的OpenMP 4.0编程标准,实现了LESAP软件面向异构并行平台的移植,并采用SIMD向量化、数据传输优化、基于网格块划分的负载均衡等技术进行了性能优化.性能测试结果表明异构版本比纯CPU版本性能更佳.在天河二号超级计算机的1个结点(含2个12核的Intel Xeon E5-2692CPU加3块Intel Xeon Phi 31S1P协处理器)上,对一个实际超燃发动机燃烧数值模拟问题,网格规模为532万单元时,每时间步的平均执行时间从原来纯CPU版的64.72s减少到21.06s,性能加速比达到约3.07.
- 杨梅芳车永刚高翔
- 并行模拟中支持踪迹文件并行输入输出的方法
- 本发明公布了一种并行模拟中支持踪迹文件并行输入输出的方法,目的是提出一种支持分布式并行Trace文件I/O的方法,提高并行模拟过程中Trace文件I/O的效率和模拟精度。技术方案是先构建运行并行模拟器的由主控节点和模拟节...
- 车永刚徐传福王勇献王正华彭宇行
- 非结构网格CFD共享存储并行处理方法和系统
- 本申请涉及非结构网格CFD共享存储并行处理方法和系统,该方法包括调用网格剖分工具按照仅剖分物理分割区的剖分策略,对待求解的航行器非结构网格逐层进行递归剖分并对剖分后生成的各个子网格分区内的网格实体进行重排序;网格实体包括...
- 徐传福邱昊中陈世钊丁越车永刚郭晓威高翔李超张翔林拥真汪青松戴未希周正
- 迭代编译优化技术综述被引量:3
- 2008年
- 首先介绍了迭代编译的基本概念,然后讨论了其起源与发展,对其研究现状进行综述,主要包括优化空间的表述、优化空间的开发与搜索以及对数据输入集的敏感度分析三个方面。然后分析了目前迭代编译技术中所存在的不足。最后指出了迭代编译的未来发展趋势。
- 王正华陆平静车永刚