您的位置: 专家智库 > >

张先轶

作品数:15 被引量:21H指数:2
供职机构:中国科学院软件研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重大技术装备创新研制项目更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 6篇专利
  • 5篇期刊文章
  • 4篇会议论文

领域

  • 8篇自动化与计算...
  • 1篇理学

主题

  • 3篇矩阵
  • 3篇矩阵乘
  • 2篇代码
  • 2篇代码生成
  • 2篇代码生成工具
  • 2篇队列
  • 2篇行扫描
  • 2篇性能分析
  • 2篇语言
  • 2篇云服务
  • 2篇质谱
  • 2篇色谱
  • 2篇色谱峰
  • 2篇数据存储
  • 2篇数据存储方法
  • 2篇数据局部性
  • 2篇索引
  • 2篇体系结构
  • 2篇谱峰
  • 2篇自动生成

机构

  • 15篇中国科学院软...
  • 6篇中国科学院研...
  • 1篇石家庄铁道大...

作者

  • 15篇张先轶
  • 10篇张云泉
  • 5篇王茜
  • 4篇张常有
  • 3篇刘芳芳
  • 2篇王婷
  • 2篇胡泽林
  • 2篇段淑凤
  • 2篇刘仁芬
  • 1篇李玉成
  • 1篇王靖
  • 1篇王靖
  • 1篇袁良
  • 1篇王磊
  • 1篇陈家杰
  • 1篇李会元
  • 1篇程豪
  • 1篇王磊

传媒

  • 2篇计算机工程
  • 1篇计算机工程与...
  • 1篇数值计算与计...
  • 1篇计算机科学
  • 1篇2009年全...

年份

  • 1篇2017
  • 1篇2016
  • 2篇2015
  • 1篇2014
  • 2篇2013
  • 2篇2012
  • 1篇2011
  • 3篇2010
  • 2篇2009
15 条 记 录,以下是 1-10
排序方式:
一种稀疏矩阵的存储方法CSRL及基于该方法的SpMV实现方法
本发明公开一种稀疏矩阵的存储方法CSRL及SpMV实现方法,按行扫描稀疏矩阵A,用数组val顺序存储每个非零元值信息;定义列下标连续的若干个非零元为一个连续非零元段,用数组jas记录每个连续非零元段的第一个元素的列下标,...
刘芳芳张云泉张先轶王茜
文献传递
一种面向高性能计算的云服务消息传递方法
一种面向高性能计算的云服务消息传递方法,步骤:定义消息模板;消息产生:根据消息模板,把消息内容和相关资源打包或编号,生成消息对象实例;消息入列:从云服务平台中的消息生产方把消息对象实例装入指定消息服务系统中的指定消息队列...
张常有刘仁芬段淑凤张先轶王婷
文献传递
六边形区域快速傅里叶变换的CUDA-MPI算法及其实现被引量:4
2012年
本文研究六边形区域上快速傅里叶变换(FFTH)的CUDA—MPI算法及其实现.首先,我们通过充分利用CUDA的层次化并行机制及其库函数,设计了FFTH的高效率的CUDA算法.对于规模为3X2048。的双精度复数类型数据,我们设计的CUDA程序与CPU串行程序相比可以达到12倍加速比,如果不计内存和显存之间的数据传输,则加速比可达40倍;其计算效率与CUFFT所提供的二维方形区域FFT程序的效率基本一致.在此基础上,我们通过研究GPU上分布式并行数据的转置与排序算法,优化设计了FFTH的CUDA-MPI算法.在3×8192^2的数据规模、10节点X6GPU的计算环境下,我们的CUDA-MPI程序与CPU串行程序相比达到了55倍的加速;其效率比MPI并行版FFTW以及基于CUFFT本地计算和FFTW并行转置的方形区域并行FFT的效率都要高出很多.FFTH的CUDA-MPI算法研究和测试为大规模CPU+GPU异构计算机系统的可扩展新型算法的探索提供了参考.
陈家杰李会元张先轶
一种采用带有局部信息的压缩稀疏行的稀疏矩阵存储方法及基于该方法的SpMV实现方法
本发明公开一种稀疏矩阵的存储方法CSRL及SpMV实现方法,按行扫描稀疏矩阵A,用数组val顺序存储每个非零元值信息;定义列下标连续的若干个非零元为一个连续非零元段,用数组jas记录每个连续非零元段的第一个元素的列下标,...
刘芳芳张云泉张先轶王茜
文献传递
基于x86架构的稠密矩阵乘法汇编代码自动生成方法
本发明公开了一种基于x86架构的稠密矩阵乘法汇编代码自动生成方法,属于计算机系统应用技术领域。本方法为:1)将稠密矩阵乘法中的源矩阵A、B分别划分为多个子块矩阵;其中,矩阵A划分的子块矩阵A<Sub>Mc*Kc</Sub...
王茜张先轶张云泉
文献传递
P-QuantWiz:一种基于质谱的并行非标记定量软件
本文设计并实现了基于质谱的非标记定量软件QuantWiz,通过改变肽段定量的顺序,提高了定量软件的时间局部性和质谱数据缓存的命中次数。分析了QuantWiz的多种数据并行策略,设计并实现了按保留时间划分的并行定量软件P-...
胡泽林张云泉王靖张先轶
关键词:色谱峰
文献传递
P-QuantWiz:一种基于质谱的并行非标记定量软件被引量:1
2009年
本文设计并实现了基于质谱的非标记定量软件QuantWiz,通过改变肽段定量的顺序,提高了定量软件的时间局部性和质谱数据缓存的命中次数。分析了QuantWiz的多种数据并行策略,设计并实现了按保留时间划分的并行定量软件P-QuantWiz。通过实验验证P-QuantWiz具有良好的并行效率,当进程数为32时,并行效率为63%。
胡泽林张云泉王靖张先轶
关键词:质谱色谱峰并行化
OpenBLAS:龙芯3A CPU的高性能BLAS库
BLAS是科学计算中最基础的数学库之一,各CPU厂商都推出了针对各自CPU的优化的BLAS库。龙芯CPU是中科院计算所自主研制的通用CPU,目前已推出了龙芯3号系列。本文介绍了我们发起的基于GotoBLAS 2-1.13...
张先轶王茜张云泉
关键词:数学库通用CPU
JULIA语言与并行计算
张常有张先轶
基于x86架构的稠密矩阵乘法汇编代码自动生成方法
本发明公开了一种基于x86架构的稠密矩阵乘法汇编代码自动生成方法,属于计算机系统应用技术领域。本方法为:1)将稠密矩阵乘法中的源矩阵A、B分别划分为多个子块矩阵;其中,矩阵A划分的子块矩阵A<Sub>Mc*Kc</Sub...
王茜张先轶张云泉
文献传递
共2页<12>
聚类工具0