黎雷生
- 作品数:13 被引量:26H指数:4
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金中国科学院战略性先导科技专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种适合复杂异构系统的HPL矩阵更新优化方法
- 本发明公开了一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次...
- 黎雷生马文静赵海涛孙家昶李会元
- 文献传递
- 千万亿次级无网格粒子模拟程序:层次化并行与超线性加速
- 以千万亿次(1 015Flop/s)超级计算机的出现为标志,数值模拟已经进入一个全新的时代——一个可以使用数万至数十万个处理嚣核心进行超大规模并行计算的时代petaPar粒子模拟程序面向千万亿次级计算。在统一框架下实现两...
- 黎雷生田荣
- 关键词:可扩展性
- 步态识别研究
- 随着现代社会对安全需求的提高,生物识别技术作为实现安全的手段得到大力的研究和发展。步态识别是生物识别技术研究中的新领域。医学研究证明,人的步态具有唯一性,根据人的步态可以识别其身份。步态识别研究内容包括运动分割、特征提取...
- 黎雷生
- 关键词:步态识别特征提取ZERNIKE矩主分量分析BP神经网络
- 文献传递
- 高可扩展可容错的无网格/粒子程序petaPar及其测试
- 2013年
- petaPar粒子模拟程序面向千万亿次级计算,在统一框架下实现两种广受关注的粒子模拟算法:光滑粒子流体动力学(Smoothed Particle Hydrodynamics,SPH)和物质点法(Material Point Method,MPM)。代码支持多种材料模型、强度模型和失效模型,适合模拟大变形、高应变率和流固耦合问题。支持纯MPI和MPI+X混合两种并行模型。系统具有可容错性,支持无人值守变进程重启。在Titan上测试表明,petaPar可线性扩展到26万CPU核,SPH和MPM算法并行效率相对8 192核分别为87%和90%。
- 黎雷生田荣
- 关键词:SPHMPM
- 千万亿次可扩展可容错自由网格数值模拟系统被引量:3
- 2015年
- 在千万亿次计算能力的驱动下,数值软件的发展进入了一个以海量并行为基本特征的历史转折期,可扩展和可容错成为大规模数值模拟的两大关键技术.petaPar模拟程序是以对传统数值技术形成优势互补的无网格类方法为切入点,面向千万亿次级计算而开发的下一代新兴通用数值模拟程序.petaPar在统一架构下实现了光滑粒子动力学(smoothed particle hydrodynamics,SPH)和物质点法(material point method,MPM)两种最为成熟和有效的无网格/粒子算法,支持多种强度、失效模型和状态方程;其中MPM支持改进的接触算法,可以处理上百万离散物体的非连续变形和相互作用计算.系统具有以下特点:1)高可扩展.实现单核单Patch极端情形下计算和通信的完全重叠,支持动态负载均衡;2)可容错.支持无人值守变进程重启动,在系统硬件出现局部热故障时可以不中止计算;3)适应硬件体系结构异构架构的变化趋势,同时支持flat MPI和MPI+Pthreads并行模型.程序在Titan千万亿次超级计算机上进行了全系统规模的可扩展性测试,结果表明该代码可线性扩展到26万个CPU核,SPH和MPM的并行效率分别为100%和96%.
- 黎雷生王朝尉马志涛霍志刚田荣
- 关键词:多线程动态负载平衡
- 一种适合复杂异构系统的HPL的Panel分解优化方法和装置
- 本发明公开一种适合复杂异构系统的HPL的Panel分解优化方法和装置。该优化方法通过分析HPL中Panel分解基础代码,得出影响系统性能的瓶颈,为了进一步提高系统效率,采用基本参数调优、GPU加速Panel分解DGEMM...
- 赵慧杨文浩黎雷生张娅孙家昶
- 文献传递
- GCC到Nios系统的移植研究与实现被引量:2
- 2007年
- 分析开源编译器GCC的内部结构及其可移植机制,提出GCC前后端分离的结构以适合移植到不同硬件平台.以Nios嵌入式处理器为例,研究了移植GCC的步骤以及必须的数据文件,机器描述文件、宏定义文件等.给出了算术逻辑运算指令、数据转移指令、控制指令这3种典型指令所对应的RTL表达式编写方法和模板.通过使用一个C程序对移植后的GCC编译器进行测试,结果表明,移植后的GCC能够产生正确的汇编代码.
- 吴克寿任小西李仁发黎雷生
- 关键词:编译器GCC可移植性
- 一种适合复杂异构系统的HPL矩阵更新优化方法
- 本发明公开了一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次...
- 黎雷生马文静赵海涛孙家昶李会元
- 文献传递
- 基于不变矩的步态识别被引量:6
- 2005年
- 提出了一种利用不变矩进行步态识别的方法。该方法把二维人体空间轮廓信号变换为一维不变矩信号,把人体的步态序列变换为不变矩矢量,对不变矩矢量进行规格化,然后根据规格化不变矩矢量进行步态识别。实验中,本文的方法取得很好的效果。
- 黎雷生肖德贵
- 关键词:步态识别
- 一种适合复杂异构系统的HPL的Panel分解优化方法和装置
- 本发明公开一种适合复杂异构系统的HPL的Panel分解优化方法和装置。该优化方法通过分析HPL中Panel分解基础代码,得出影响系统性能的瓶颈,为了进一步提高系统效率,采用基本参数调优、GPU加速Panel分解DGEMM...
- 赵慧杨文浩黎雷生张娅孙家昶
- 文献传递