您的位置: 专家智库 > >

国家自然科学基金(20906091)

作品数:2 被引量:9H指数:2
相关作者:葛蔚王小伟张云杨朝合更多>>
相关机构:中国石油大学(华东)中国科学院过程工程研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术理学化学工程更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...
  • 1篇化学工程
  • 1篇理学

主题

  • 2篇格子BOLT...
  • 1篇直接数值模拟
  • 1篇数值模拟
  • 1篇图形处理单元
  • 1篇方腔
  • 1篇方腔流
  • 1篇COUETT...
  • 1篇GPU
  • 1篇LATTIC...
  • 1篇OPENMP

机构

  • 1篇中国石油大学...
  • 1篇中国科学院过...

作者

  • 1篇杨朝合
  • 1篇张云
  • 1篇王小伟
  • 1篇葛蔚

传媒

  • 1篇计算机与应用...
  • 1篇Scienc...

年份

  • 1篇2012
  • 1篇2011
2 条 记 录,以下是 1-2
排序方式:
多松弛时间格子Boltzmann方法在GPU上的实现被引量:5
2011年
近年来,随着统一计算设备构架(CUDA)的出现,高端图形处理器(GPU)在图像处理、计算流体力学等科学计算领域的应用得到了快速发展。属于介观数值方法的格子Boltzmann方法(LBM)是1种新的计算流体力学(CFD)方法,具有算法简单、能处理复杂边界条件、压力能够直接求解等优势,在多相流、湍流、渗流等领域得到了广泛应用。LBM由于具有内在的并行性,特别适合在GPU上计算。采用多松弛时问模型(MRT)的LBM,受松弛因子的影响较小并且数值稳定性较好。本文实现了MRT-LBM在基于CUDA的GPU上的计算,并通过计算流体力学经典算例——二维方腔流来验证计算的正确性。在雷诺数Re=[10,10^4]之间,计算了多达26种雷诺数的算例,并将Re=10^2,4×10^2,10^3,2×10^3,5×10^3,7.5x10^3算例对应的主涡中心坐标与文献中结果进行了对比。计算结果与文献数值实验符合较好,从而验证了算法实现的正确忡,并显示出MRT-LBM具有更优的数值稳定性。奉文还分析了在GPU上MRT-LBM的计算性能并与CPU的计算进行了比较,结果表明,GPU可以极大椭栅mMR下TRM的计簋。NvTDIA Tesla C2050相对于单核Intel Xeon 5430 CPU的加速比约为60倍。
张云王小伟葛蔚杨朝合
关键词:格子BOLTZMANN方法方腔流GPU
Efficient parallel implementation of the lattice Boltzmann method on large clusters of graphic processing units被引量:6
2012年
Many-core processors, such as graphic processing units (GPUs), are promising platforms for intrinsic parallel algorithms such as the lattice Boltzmann method (LBM). Although tremendous speedup has been obtained on a single GPU compared with mainstream CPUs, the performance of the LBM for multiple GPUs has not been studied extensively and systematically. In this article, we carry out LBM simulation on a GPU cluster with many nodes, each having multiple Fermi GPUs. Asynchronous execution with CUDA stream functions, OpenMP and non-blocking MPI communication are incorporated to improve efficiency. The algorithm is tested for two-dimensional Couette flow and the results are in good agreement with the analytical solution. For both the oneand two-dimensional decomposition of space, the algorithm performs well as most of the communication time is hidden. Direct numerical simulation of a two-dimensional gas-solid suspension containing more than one million solid particles and one billion gas lattice cells demonstrates the potential of this algorithm in large-scale engineering applications. The algorithm can be directly extended to the three-dimensional decomposition of space and other modeling methods including explicit grid-based methods.
XIONG QinGangLI BoXU JiFANG XiaoJianWANG XiaoWeiWANG LiMinHE XianFengGE Wei
关键词:格子BOLTZMANN方法图形处理单元COUETTE流OPENMP直接数值模拟
共1页<1>
聚类工具0