您的位置: 专家智库 > >

徐磊

作品数:16 被引量:29H指数:3
供职机构:上海超级计算中心更多>>
发文基金:国家高技术研究发展计划国家自然科学基金上海市科委科研计划项目更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 11篇期刊文章
  • 4篇会议论文
  • 1篇科技成果

领域

  • 12篇自动化与计算...
  • 3篇理学

主题

  • 4篇异构
  • 4篇异构平台
  • 3篇编程
  • 3篇GPU集群
  • 3篇MPI
  • 2篇多核
  • 2篇多线程
  • 2篇性能比较
  • 2篇性能分析
  • 2篇亚式期权
  • 2篇运行性
  • 2篇运行性能
  • 2篇随机波动率
  • 2篇期权
  • 2篇线程
  • 2篇魔方
  • 2篇格子BOLT...
  • 2篇编程模型
  • 2篇NPB
  • 2篇FDTD

机构

  • 16篇上海超级计算...
  • 2篇同济大学

作者

  • 16篇徐磊
  • 15篇徐莹
  • 10篇张丹丹
  • 3篇寇大治
  • 2篇徐承龙
  • 2篇李根国
  • 2篇姜恺
  • 2篇姜广鑫
  • 1篇吴建成
  • 1篇刘波
  • 1篇张挺
  • 1篇陈家慧
  • 1篇王涛
  • 1篇徐彬
  • 1篇时伟
  • 1篇魏玉琪
  • 1篇刘杰
  • 1篇梁义娟
  • 1篇刘晶
  • 1篇邹伟新

传媒

  • 5篇计算机工程与...
  • 4篇计算机应用与...
  • 1篇同济大学学报...
  • 1篇计算机科学
  • 1篇2009年全...
  • 1篇2009年全...
  • 1篇2013全国...

年份

  • 1篇2014
  • 3篇2013
  • 6篇2012
  • 2篇2011
  • 4篇2009
16 条 记 录,以下是 1-10
排序方式:
SSearch基于众核加速的并行模型分析
2012年
介绍SSearch核心算法的特点,分析该算法的并行性,并以GPU以及类Cell处理器为例分析算法对众核系统的适用性。在此基础上提出众核系统下的SSearch并行模型。
张丹丹徐莹徐磊李根国
异构平台下格子Boltzmann方法实现及性能分析
论文对CPU+GPU异构平台下的多种并行编程模式进行了研究,并针对格子Boltzmann方法实现了CUDA, MPI+CUDA, MPI+OpenMP+CUDA多级并行算法。 结果表明,算法具有较好的加速性能;提出的根据...
张丹丹徐莹徐磊
关键词:异构平台并行编程模式负载均衡图形处理单元
随机波动率下的亚式期权定价问题在GPU集群上的实现
2012年
期权定价作为计算金融领域的核心问题之一,越来越受到关注。随着期权交易的规模和交易量的迅速增长,当前的期权定价平台越来越受到挑战,在尽可能短的时间内对期权进行定价变得越来越困难。传统的计算平台通常使用基于CPU的计算集群,而图形处理器(GPU)具有更高的浮点性能和访存带宽,在价格与功耗方面也优于CPU。尝试使用GPU集群来对具有随机波动率的亚式期权进行定价,同时使用带控制变量的Monte Carlo方法,减小模拟的方差。最终的测试结果表明GPU集群较CPU集群具有更多的优势,适合应用于期权定价领域。
徐磊徐莹姜广鑫梁义娟寇大治徐承龙
关键词:GPU集群CUDA亚式期权MPI
气固两相流全分辨率直接数值模拟的并行算法
2014年
用沉浸边界法对气固两相流进行全分辨率直接数值模拟,介绍并行算法及其并行效率。考察球形颗粒的空间分辨率等对计算精度的影响,对颗粒雷诺数Rep=1~150,颗粒直径与计算网格比大于20时,该并行算法获得的计算精度较高。
徐磊徐莹
关键词:并行计算多相流计算流体力学
GPU集群上的三维UPML-FDTD算法的实现及优化
高性能计算领域,拥有强大浮点计算性能的协处理器正在快速的发展。近年来,利用协处理器如GPU来加速时域有限差分(FDTD)算法的计算过程成为电磁研究领域的热点问题。本文在GPU集群上买现了三维UPML—FDTD算法并进行了...
徐磊徐莹蒋荣琳张丹丹
关键词:FDTDGPU集群MPI
超算中心Xfinity高性能计算平台软件v1.0
李根国姜恺吴建成刘杰徐彬魏玉琪邓雪滨张挺刘波刘晶张伟刘祎洋徐磊张丹丹陈家慧徐莹薛刚戴坚君邹伟新王涛寇大治时伟
该软件面向高性能计算用户,整合上海超级计算中心及用户内部资源,为用户提供方便、快捷的使用资源的方式,包括文件管理、作业提交、作业管理、动态信息查询、统计信息查询、交流空间、命令行以及用户管理、项目管理等功能;保证用户使用...
关键词:
三维Navier-Stokes方程分步法的并行算法在异构平台上实现初探被引量:1
2012年
本文选取了三维不可压缩流动方程的分步法(fractional-step method),其中动量方程使用BiCGSTAB算法进行迭代求解,而压力泊松方程使用Fourier变换法进行直接求解。本文研究该算法在集群平台上的并行算法,从区域分解入手,分析一维、两维、三维区域划分三种情况下,各并行处理器上的计算量与通讯量,根据分析结果使用两维区域分解。分析BiCGSTAB算法和泊松Fourier变换法在GPGPU异构平台上的移植方法。最后,本文分析了BiCGSTAB和泊松方程Fourier变换法两种算法在CPU集群和GPGPU异构平台上的并行性能结果。
徐莹徐磊姜恺
关键词:异构平台GPGPU分步法
高性能计算中的亚式期权蒙特卡罗加速方法被引量:1
2013年
研究蒙特卡罗控制变量方法在CPU(central processing unit)集群和GPU(graphic processing unit)计算环境中的实现问题.以离散取样的随机波动率下的算术平均亚式期权为例,选取合适的控制变量,分别研究了在CPU集群和GPU计算中算法与硬件并行加速两者的运算效率,并讨论了模型参数的变化对计算结果的影响.数值试验表明采用算法与硬件加速相结合的方法可以极大提高计算效率、缩短运算时间.
姜广鑫徐承龙寇大治徐磊
关键词:蒙特卡罗方法随机波动率
异构平台下格子Boltzmann方法实现及性能分析被引量:1
2012年
对CPU+GPU异构平台下的多种并行编程模式进行了研究,并针对格子Boltzmann方法实现了CUDA,MPI+CUDA,MPI+OpenMP+CUDA多级并行算法。结果表明,算法具有较好的加速性能;提出的根据计算量比例参数调节CPU和GPU之间负载均衡的方法,对于在异构平台上实现多级并行处理及资源的有效利用具有一定的参考和应用价值。
张丹丹徐莹徐磊
关键词:异构平台GPU格子BOLTZMANN
基于“魔方”的不同编程模型下科学应用性能比较被引量:2
2009年
本文基于魔方(曙光5000A)"超并行"系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi-Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨节点采用混合编程模型能获得更好性能,测试结果为百万亿次系统的使用及应用性能的提升起到指导作用。
张丹丹徐磊徐莹
关键词:NPB
共2页<12>
聚类工具0