您的位置: 专家智库 > >

国家自然科学基金(60603055)

作品数:10 被引量:16H指数:3
相关作者:车永刚王正华徐传福陆平静方建滨更多>>
相关机构:国防科学技术大学并行与分布处理国防科技重点实验室漯河职业技术学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 10篇中文期刊文章

领域

  • 10篇自动化与计算...

主题

  • 2篇映射
  • 2篇映射方法
  • 2篇通信优化
  • 2篇负载平衡
  • 2篇TRACE
  • 1篇迭代
  • 1篇多核
  • 1篇多核集群
  • 1篇性能模拟
  • 1篇性能评测
  • 1篇遗传算法
  • 1篇任务映射
  • 1篇体系结构
  • 1篇评测
  • 1篇踪迹
  • 1篇位函数
  • 1篇系统性能
  • 1篇流编程模型
  • 1篇流处理器
  • 1篇面向对象

机构

  • 9篇国防科学技术...
  • 1篇漯河职业技术...
  • 1篇并行与分布处...

作者

  • 10篇王正华
  • 10篇车永刚
  • 5篇徐传福
  • 3篇翁玉芬
  • 3篇陆平静
  • 3篇方建滨
  • 1篇束尧
  • 1篇曹维
  • 1篇王荣

传媒

  • 4篇计算机工程与...
  • 2篇计算机工程
  • 2篇计算机工程与...
  • 1篇国防科技大学...
  • 1篇计算机科学

年份

  • 1篇2012
  • 2篇2010
  • 5篇2009
  • 2篇2008
10 条 记 录,以下是 1-10
排序方式:
基于并行模拟的多核集群系统性能预测和分析被引量:6
2010年
针对多核集群系统所表现出的新的性能特征,提出了面向多核集群系统消息传递应用程序的并行模拟模型并设计、实现了一个并行模拟器MCPSim(Multi-core Cluster Parallel Simulator),MCPSim在功能模型和性能模型上体现了片内核间、结点内片间以及结点间等三个层次上消息通信的特点,同时支持对应用的消息数量、通信量等的百分比分布的profiling功能,采用PRIMEJ、acobi3D、NPB IS以及HPL等Benchmark程序对MCPSim进行了测试,结果表明MCPSim性能预测的精度优于BigSim,同时能够广泛应用于针对多核集群系统消息传递应用程序的性能分析中。
徐传福车永刚王正华
关键词:多核集群
地球引力位函数在流处理器上的实现与分析
2009年
流处理器是新型高性能微处理器的代表之一。该文通过分析Imagine流处理器体系结构,实现某卫星轨道预报系统核心子程序CBPTRB,对基于Imagine的钟精确模拟器ISim进行性能测试,并将结果与该程序在普通x86处理器上的性能进行对比,同时根据实验结果提出改进方法。
曹维车永刚王正华
关键词:流编程模型
Trace生成对大规模并行性能模拟的影响及其改进策略
2012年
Trace生成是trace驱动体系结构模拟中不可或缺的步骤。Trace不仅需要占用大量存储空间,其生成过程还可能对目标应用程序的模拟执行产生一定程度的干扰,导致性能数据误差。Trace驱动并行性能模拟器由于其设计实现特点和所运行的宿主并行平台的多样性,使得trace生成的影响具有其独特性。本文选取典型并行模拟器BigSim和若干具有不同计算通信比的目标并行程序,在三个支持不同traceI/O方式的宿主机平台上设计实验评估了trace生成对并行性能模拟的影响,结果表明trace生成对模拟效率和精度均有较大的影响,并分析了这种影响与并行模拟器实现和宿主机平台I/O方式的关系,进而讨论了几种可行的改进方案,对trace驱动并行模拟器设计、实现和使用具有一定的指导意义。
徐传福王荣车永刚王正华
关键词:踪迹体系结构
结合模型和迭代编译优化矩阵相乘程序被引量:1
2009年
高性能计算应用程序获得的持续性能与机器峰值性能的差距日益扩大,很大程度上制约着高性能计算的发展。程序变换通过对程序进行适应机器体系结构特征的优化变换,提高程序实际执行性能,是解决该问题的有效途径之一。很多高级程序变换均具有数值参数,为了获得最优性能,需要仔细选择参数的值。传统的编译器使用简单的模型选择这些参数,难以适应日趋复杂的硬件平台和应用程序。迭代编译通过生成不同的程序版本并在实际硬件评估上运行程序,来评估关键优化参数的值并决定能够产生最优性能的值,显著优于静态方法,但巨大的优化开销限制了其应用范围。本文针对矩阵相乘程序提出一种结合性能模型和迭代编译的优化方法,利用基于对机器体系结构和程序的经验知识构造性能模型约束优化空间,并使用遗传算法加速在优化空间中寻找优秀解的过程。实验结果表明,该方法可以较低的开销获得更优的性能优化效果。
陆平静王正华车永刚
关键词:遗传算法
多面体表示技术及在程序性能优化中的应用被引量:3
2008年
多面体表示技术提供一种统一化的方式来表示程序变换和程序变换组合,有利于最优程序变换的搜索。论文首先介绍并评价了几种典型的多面体表示方法,并详细介绍了Cohen提出的多面体表示模型;同时,对多面体表示在程序性能优化尤其是迭代编译中的应用进行了介绍和评价;最后。
陆平静车永刚束尧王正华
基于Trace的并行性能模拟任务映射方法
2010年
针对Trace驱动的并行性能模拟问题,提出基于Trace信息指导的映射方法CO-LP3M。CO-LP3M利用从Trace中提取的目标应用程序的通信特征,以宿主机物理进程间通信次数最小化为目标,兼顾计算负载均衡,生成并行模拟任务到宿主机的映射。对HPL程序进行实验,结果表明CO-LP3M可有效提高并行模拟性能,相对于常见的映射方式,模拟性能最多提高14.7%。在此基础上给出CO-LP3M的扩展技术SCO-LP3M。
方建滨徐传福车永刚翁玉芬王正华
关键词:任务映射通信优化负载平衡
迭代编译优化技术综述被引量:3
2008年
首先介绍了迭代编译的基本概念,然后讨论了其起源与发展,对其研究现状进行综述,主要包括优化空间的表述、优化空间的开发与搜索以及对数据输入集的敏感度分析三个方面。然后分析了目前迭代编译技术中所存在的不足。最后指出了迭代编译的未来发展趋势。
王正华陆平静车永刚
大规模并行计算机系统并行性能模拟技术研究被引量:2
2009年
性能模拟技术是计算机系统性能评价的重要手段。介绍了面向大规模并行计算机系统以及消息传递应用程序的并行性能模拟技术,总结了相关的关键技术和国内外研究现状。对几个代表性的并行模拟器系统进行了详细介绍。结合并行计算机系统和应用的发展趋势,讨论了未来并行模拟器设计、实现面临的问题和可能的解决方案。
徐传福车永刚王正华
关键词:并行计算机
POSE中乐观同步策略研究被引量:2
2009年
同步策略是并行离散事件模拟的关键技术之一。POSE是一种面向对象的可扩展的计算机体系结构并行模拟框架,可进行大规模系统的并行模拟。剖析了POSE框架中的乐观同步策略,按照时间窗口调整状况将其自适应策略分为半自适应策略和完全自适应策略;对自适应乐观同步策略的模拟速度与精度进行了深入的测试比较,发现经过调整半自适应乐观策略能够取得更好的性能;也发现现有完全自适应算法中存在窗口调节反馈滞后和GVT计算开销过大等问题,是其乐观策略优化的方向之一。
方建滨车永刚翁玉芬王正华
关键词:性能评测
一种并行性能模拟中LP到PP的高效映射方法
2009年
LP到PP的高效映射是加速并行性能模拟的关键技术之一。针对交互规则的并行应用程序,设计映射生成方法A2-LP3M从Trace中提取LP间的交互模式,以宿主机物理进程间通信最小化为目标,兼顾计算负载平衡,从循环块映射中选取合适的映射方式。实验表明,相对于常规映射方法,A2-LP3M减少并行模拟时间最多可达16.2%。
方建滨徐传福车永刚翁玉芬王正华
关键词:映射通信优化负载平衡
共1页<1>
聚类工具0