您的位置: 专家智库 > >

李会元

作品数:20 被引量:26H指数:3
供职机构:中国科学院软件研究所更多>>
发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术理学一般工业技术更多>>

文献类型

  • 14篇期刊文章
  • 5篇专利
  • 1篇科技成果

领域

  • 11篇自动化与计算...
  • 10篇理学
  • 1篇一般工业技术

主题

  • 5篇异构
  • 4篇拷贝
  • 4篇HPL
  • 3篇异步
  • 3篇异构系统
  • 3篇谱方法
  • 2篇元方法
  • 2篇数据传输
  • 2篇数据拷贝
  • 2篇特征值
  • 2篇通信
  • 2篇通信量
  • 2篇谱元方法
  • 2篇网络
  • 2篇网络传输
  • 2篇六边形
  • 2篇解包
  • 2篇解压
  • 2篇解压缩
  • 2篇浮点

机构

  • 20篇中国科学院软...
  • 6篇中国科学院大...
  • 3篇中国科学院研...
  • 1篇中国科学院
  • 1篇上海大学

作者

  • 20篇李会元
  • 7篇孙家昶
  • 5篇马文静
  • 3篇黎雷生
  • 3篇赵海涛
  • 2篇刘芳芳
  • 2篇牛树梓
  • 2篇乔海军
  • 2篇赵玉文
  • 1篇杨志杰
  • 1篇余元
  • 1篇张云泉
  • 1篇纪园园
  • 1篇金钟
  • 1篇陆忠华
  • 1篇杨超
  • 1篇张先轶
  • 1篇迟学斌
  • 1篇李明亮
  • 1篇陈家杰

传媒

  • 6篇数值计算与计...
  • 2篇软件学报
  • 2篇中文信息学报
  • 2篇应用数学与计...
  • 1篇计算数学
  • 1篇中国科学院院...

年份

  • 3篇2023
  • 2篇2022
  • 3篇2021
  • 2篇2020
  • 1篇2019
  • 1篇2017
  • 1篇2015
  • 2篇2013
  • 1篇2012
  • 1篇2011
  • 1篇2010
  • 1篇2009
  • 1篇2005
20 条 记 录,以下是 1-10
排序方式:
任意三角形Laplace特征值问题谱方法的数值对比研究被引量:1
2015年
本文选取多项式、有理多项式以及三角函数等五类函数作为基函数,设计相应的谱方法逼近格式并实现相应算法,对任意三角形上Laplace特征值问题进行数值求解对比研究.比较实验结果显示,谱方法相较于经典有限差分、有限元等低阶方法有较多的可信特征值;其中的Koornwinder多项式谱方法与基于Koornwinder多项式的有理谱方法,其可信特征值的数量达到全部计算特征值的4/π^2,并且达到“指数阶收敛”;而三角函数谱方法,则保持了稳定的收敛阶且有较多的可信特征值.
单炜琨李会元
关键词:谱方法LAPLACE特征值
非规则区域傅氏变换与快速算法
孙家昶李会元杨志杰杨超
该成果是将逼近与偏微分方程相结合,把Fourier方法推广到一类非规则区域,理论上推广到任意m维的m+1方向分割,并建立了相应的离散快速算法(HFFT)。
关键词:
关键词:傅氏变换
六边形区域快速傅里叶变换的CUDA-MPI算法及其实现被引量:4
2012年
本文研究六边形区域上快速傅里叶变换(FFTH)的CUDA—MPI算法及其实现.首先,我们通过充分利用CUDA的层次化并行机制及其库函数,设计了FFTH的高效率的CUDA算法.对于规模为3X2048。的双精度复数类型数据,我们设计的CUDA程序与CPU串行程序相比可以达到12倍加速比,如果不计内存和显存之间的数据传输,则加速比可达40倍;其计算效率与CUFFT所提供的二维方形区域FFT程序的效率基本一致.在此基础上,我们通过研究GPU上分布式并行数据的转置与排序算法,优化设计了FFTH的CUDA-MPI算法.在3×8192^2的数据规模、10节点X6GPU的计算环境下,我们的CUDA-MPI程序与CPU串行程序相比达到了55倍的加速;其效率比MPI并行版FFTW以及基于CUFFT本地计算和FFTW并行转置的方形区域并行FFT的效率都要高出很多.FFTH的CUDA-MPI算法研究和测试为大规模CPU+GPU异构计算机系统的可扩展新型算法的探索提供了参考.
陈家杰李会元张先轶
基于浮点数压缩技术的大规模FFT实现方法及装置
本公开涉及一种基于浮点数压缩技术的大规模FFT实现方法及装置,所述方法包括:对第i个维度的FFT计算结果进行共享指数浮点数压缩,并将压缩结果打包成第i个维度的压缩数据之后,拷贝至所述主机端;获取所述第i个维度的压缩数据后...
赵玉文刘芳芳马文静李会元彭远驰
六边形Fourier谱方法被引量:3
2013年
首先,建立了晶格Fourier分析的一般理论,并具体研究了六边形区域上周期函数的数值逼近.在此基础上,提出了六边形区域上的椭圆型偏微分方程的周期问题求解的六边形Fourier谱方法,设计了相应谱格式快速实现算法,建立了Fourier谱方法的稳定性与收敛性理论.同方形区域上的经典Fourier谱方法一样,六边形Fourier谱方法可以充分利用快速Fourier变换,并具备了"无穷阶"的谱收敛速度.
李会元乔海军
关键词:周期FOURIER谱方法椭圆偏微分方程
基于浮点数压缩技术的大规模FFT实现方法及装置
本公开涉及一种基于浮点数压缩技术的大规模FFT实现方法及装置,所述方法包括:对第i个维度的FFT计算结果进行共享指数浮点数压缩,并将压缩结果打包成第i个维度的压缩数据之后,拷贝至所述主机端;获取所述第i个维度的压缩数据后...
赵玉文刘芳芳马文静李会元彭远驰
二维各向同性湍流直接数值模拟的六边形谱方法及GPU实现和优化被引量:1
2013年
本文在六边形傅里叶分析及六边形快速傅里叶变换的基础上,提出了二维各向同性湍流直接数值模拟的对偶六边形傅里叶谱方法和六边形傅里叶谱方法,基于二维Navier-Stokes方程的涡度-速度形式,构造了两种六边形傅里叶谱方法的离散格式,设计了其快速求解算法,并且在GPU高性能平台上研制并优化了相应的数值模拟程序.根据方程的具体形式和六边形傅里叶谱方法的特点,从算法层面对方程的求解过程,尤其是非线性Jacobian项快速计算进行优化,经过优化之后,方程求解算法的计算复杂度减少了约30%;根据GPU的体系结构和数值模拟程序的功能要求,将计算模块全部设计为在GPU上运行的kernel函数,尽量避免内存与显存之间的数据拷贝,并在软件工程层面上对代码进行性能优化.优化后的GPU程序获得了高达50倍的加速比.在此基础上,我们对二维各向同性湍流进行了初步的数值模拟,并考察了在不同初始雷诺数条件下,能量和拟涡能随着时间的演变曲线.计算结果表明六边形傅里叶谱方法与传统的傅里叶谱方法一样高效精确.
乔海军李会元
关键词:CUDA直接数值模拟
一种适合复杂异构系统的HPL矩阵更新优化方法
本发明公开了一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次...
黎雷生马文静赵海涛孙家昶李会元
文献传递
一种基于CW-RNN的多时间尺度序列建模推荐算法被引量:5
2020年
序列化推荐试图利用用户与物品的历史交互序列,预测下次即将交互的物品。针对序列化推荐中推荐物品依赖于用户的长时间全局兴趣、中时间兴趣还是短时间局部兴趣的不确定性,该文提出了一种基于CW-RNN的多时间尺度序列建模推荐算法。首先,该算法引入CW-RNN层,从用户与物品的历史交互序列中抽取多个时间尺度的用户兴趣特征。然后,通过尺度维卷积来建模对不同时间尺度的用户兴趣特征的依赖,生成多时间尺度用户兴趣特征的统一表示。最后,利用全连接层建模统一的多尺度用户兴趣特征和隐式物品特征的交互关系。在MovieLens-1M和Amazon Movies and TV两个公开数据集上的实验结果表明,相比于现有最优的序列推荐算法,该文提出的算法在准确率上分别提升了3.80%和8.63%。
袁涛牛树梓李会元
关键词:多时间尺度动态建模
非线性守恒律高阶谱粘性法的收敛性
2011年
讨论守恒型方程周期边界问题的高阶谱粘性方法逼近解的收敛性.在逼近解一致有界的假设下,通过建立其高阶导数的上界估计,证明了高阶谱粘性方法逼近解具有同二阶谱粘性方法逼近解相类似的高频衰减性质.以此为基础,用补偿列紧法证明了高阶谱粘性方法逼近解收敛于守恒型方程的物理解.
纪园园李会元
关键词:守恒型方程收敛性
共2页<12>
聚类工具0