公共文化服务平台

2024年7月17日星期三

|

欢迎来到南京江宁区图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

张丹丹: 作品数：14 被引量：28H指数：3; 供职机构：上海超级计算中心更多>>; 发文基金：国家高技术研究发展计划国家自然科学基金博士研究生创新基金更多>>; 相关领域：自动化与计算机技术理学更多>>

合作作者

徐莹上海超级计算中心
徐磊上海超级计算中心
赵鹏上海大学
钱跃竑上海市应用数学和力学研究所
李根国上海超级计算中心

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

7篇期刊文章
6篇会议论文
1篇科技成果

领域

13篇自动化与计算...
1篇理学

主题

6篇性能分析
5篇格子BOLT...
4篇并行计算
3篇内存
3篇内存优化
3篇编程
3篇CACHE优...
2篇多核
2篇多线程
2篇性能比较
2篇异构
2篇异构平台
2篇运行性
2篇运行性能
2篇线程
2篇魔方
2篇编程模型
2篇NPB
2篇FDTD
2篇GPU集群

机构

14篇上海超级计算...
3篇复旦大学
3篇上海大学
1篇上海市应用数...

作者

14篇张丹丹
10篇徐磊
10篇徐莹
3篇赵鹏
2篇钱跃竑
2篇李根国
1篇吴建成
1篇汪鲁兵
1篇刘波
1篇张挺
1篇陈家慧
1篇王涛
1篇徐彬
1篇时伟
1篇魏玉琪
1篇寇大治
1篇田振夫
1篇刘杰
1篇刘晶
1篇姜恺

传媒

3篇计算机工程与...
2篇计算机应用与...
1篇微电子学与计...
1篇计算机科学
1篇2008年全...
1篇2009年全...
1篇2009年全...
1篇2013全国...
1篇2008年全...

年份

2篇2013
2篇2012
2篇2011
5篇2009
3篇2008

共 14 条记录，以下是 1-10

全选清除导出

排序方式：

GPU集群上的三维UPML-FDTD算法的实现及优化: 高性能计算领域，拥有强大浮点计算性能的协处理器正在快速的发展。近年来，利用协处理器如GPU来加速时域有限差分(FDTD)算法的计算过程成为电磁研究领域的热点问题。本文在GPU集群上买现了三维UPML—FDTD算法并进行了...; 徐磊徐莹蒋荣琳张丹丹; 关键词：FDTD GPU集群 MPI

SSearch基于众核加速的并行模型分析: 2012年; 介绍SSearch核心算法的特点,分析该算法的并行性,并以GPU以及类Cell处理器为例分析算法对众核系统的适用性。在此基础上提出众核系统下的SSearch并行模型。; 张丹丹徐莹徐磊李根国

超算中心Xfinity高性能计算平台软件v1.0: 李根国姜恺吴建成刘杰徐彬魏玉琪邓雪滨张挺刘波刘晶张伟刘祎洋徐磊张丹丹陈家慧徐莹薛刚戴坚君邹伟新王涛寇大治时伟; 该软件面向高性能计算用户，整合上海超级计算中心及用户内部资源，为用户提供方便、快捷的使用资源的方式，包括文件管理、作业提交、作业管理、动态信息查询、统计信息查询、交流空间、命令行以及用户管理、项目管理等功能；保证用户使用...; 关键词：

格子Boltzmann算法并行性能的系统分析被引量：1: 2009年; 从处理器映射方式、域分解方式、通信开销、通信模式、可扩展性等方面对格子Boltzmann算法的并行性能作了全面系统的分析,并提出了对该类并行程序效率定量化分析的方法。经过相应的测试与分析,说明该方法对提高大规模并行计算的效率具有指导作用。; 张丹丹赵鹏钱跃竑; 关键词：并行计算性能分析

异构平台下格子Boltzmann方法实现及性能分析被引量：1: 2012年; 对CPU+GPU异构平台下的多种并行编程模式进行了研究,并针对格子Boltzmann方法实现了CUDA,MPI+CUDA,MPI+OpenMP+CUDA多级并行算法。结果表明,算法具有较好的加速性能;提出的根据计算量比例参数调节CPU和GPU之间负载均衡的方法,对于在异构平台上实现多级并行处理及资源的有效利用具有一定的参考和应用价值。; 张丹丹徐莹徐磊; 关键词：异构平台 GPU 格子BOLTZMANN

基于“魔方”的不同编程模型下科学应用性能比较被引量：2: 2009年; 本文基于魔方(曙光5000A)"超并行"系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi-Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨节点采用混合编程模型能获得更好性能,测试结果为百万亿次系统的使用及应用性能的提升起到指导作用。; 张丹丹徐磊徐莹; 关键词：NPB

格子Boltzmann并行程序的优化与性能分析被引量：3: 2008年; 基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提高.; 赵鹏张丹丹汪鲁兵田振夫钱跃竑; 关键词：格子BOLTZMANN CACHE优化内存优化并行计算

格子Boltzmann并行程序的优化与性能分析: 基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提...; 赵鹏张丹丹汪鲁兵田振夫钱跃竑; 关键词：格子BOLTZMANN CACHE优化内存优化并行计算; 文献传递

异构平台下格子Boltzmann方法实现及性能分析: 论文对CPU+GPU异构平台下的多种并行编程模式进行了研究，并针对格子Boltzmann方法实现了CUDA， MPI+CUDA， MPI+OpenMP+CUDA多级并行算法。结果表明，算法具有较好的加速性能;提出的根据...; 张丹丹徐莹徐磊; 关键词：异构平台并行编程模式负载均衡图形处理单元

基于“魔方”的不同编程模型下科学应用性能比较: 本文基于魔方(曙光5000A)“超并行”系统架构比较了不同并行编程模型下NAS Parallel Benchmark Multi Zone的性能。结果表明,在单节点共享内存存储架构下OpenMP编程模型能获得更好性能,跨...; 张丹丹徐磊徐莹; 关键词：系统架构; 文献传递

全选清除导出

共2页<1 2>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@南京江宁区图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张