李小强
- 作品数:14 被引量:12H指数:2
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信理学机械工程更多>>
- 超长指令字程序的二进制翻译方法
- 本发明的实施例提出了一种超长指令字程序的二进制翻译方法,包括以下步骤:对程序中的超长指令字进行指令解码;还原所述程序中的控制流图以及数据流图;重建类数据流计算模型下的控制流图与数据流图;对所述程序进行超长指令字程序的二进...
- 安虹刘谷徐光许牧李小强韩文廷张倩刘玉
- 文献传递
- CPU-GPU异构系统上的高层编程模型及其编译优化技术
- 由于具有不同的结构特点,使得CPU和GPU组成的异构系统能够更有效地处理通用计算任务。与CPU相比,GPU专注于提高需要更多的计算资源和存储带宽的数据并行任务的执行效率,具有更复杂的存储层次,且地址空间与CPU分离,使得...
- 李小强
- 关键词:编程模型
- 一种单指令多数据流结构上的数据处理方法及处理器
- 本发明公开了一种SIMD上的数据处理方法及处理器,包括:选取符合条件的处理多组数据流,指令具有包括标记位和索引位的谓词域;将指令进行译码,并获取标记位和索引位的值;利用标记位的值判断指令是否为谓词指令;当指令为谓词指令时...
- 安虹许牧徐光刘谷李颀任永青李小强孙涛郝秀蕊周伟谭旭
- 组网雷达估测降水系统并行化方案的设计与实现被引量:5
- 2012年
- 国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量,同时对实时性要求较高。如果缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序进行了热点分析和并行性分析,得出程序中有较多线程级并行性,从而制定了相应的并行化方案;然后使用Win32多线程和OpenMP两种技术对该程序在Intel四核处理器平台上进行了并行化。程序主要由单站处理和组网处理两部分组成。由于计算资源的限制,并行后的单站处理程序只有大约10%的性能提升,而组网处理程序则可以达到近似线性的性能提升。通过调整计算负载,并行化版本的加速比可以达到5.5。最后,可以得出该并行化方法适用于计算密集且数据吞吐量较大的一类应用。
- 吴石磊安虹李小强周伟刘谷魏学超
- 关键词:并行性分析OPENMP
- 流处理器的相变存储器主存性能优化被引量:2
- 2011年
- 将相变存储器(PCRAM)作为流处理器Imagine的主存储器,对其性能进行优化。建立(PCRAM)性能分析模型,针对PCRAM可写次数有限的缺陷,采用避免冗余位写技术,使PCRAM的生命周期延长3.4倍。利用PCRAM的非易失性,避免不必要的缓存行写回。分析访存调度算法对PCRAM性能的影响,结果表明,row/open调度算法性能较优,适合PCRAM使用。
- 郝秀蕊安虹李小强汤旭龙
- 关键词:相变存储器非易失性流处理器
- 一种输入感知的雷达回波快速聚类实现
- 2012年
- 聚类算法作为数据挖掘中的经典算法,在雷达回波的数据分析中经常被采用。然而对于规模和维度都较大的输入数据集,算法十分耗时。很多研究虽然对聚类算法进行了GPU平台的并行和优化的工作,但都忽略了输入数据集对优化的影响。因此,提出了在GPU/CUDA平台上的一种新颖的雷达快速聚类实现。该实现通过运行时的方式对输入的回波数据进行观察,以获取数据的分布信息,用以指导聚类计算在GPU上执行时的线程块调度。而该运行时模块本身的开销非常小。实验表明,引入这种输入感知的运行时调度支持后,大大削减了GPU的计算负载,获得了相对于一般策略的CUDA实现的20%~40%的性能提升,加强了算法的实时性能。
- 周伟安虹刘谷李小强吴石磊
- 关键词:聚类算法图形处理器统一计算设备架构
- 一种单指令多数据流结构上的数据处理方法及处理器
- 本发明公开了一种SIMD上的数据处理方法及处理器,包括:选取符合条件的处理多组数据流,指令具有包括标记位和索引位的谓词域;将指令进行译码,并获取标记位和索引位的值;利用标记位的值判断指令是否为谓词指令;当指令为谓词指令时...
- 安虹许牧徐光刘谷李颀任永青李小强孙涛郝秀蕊周伟谭旭
- 文献传递
- 线扫式拉曼光谱仪的研制与生物医学应用进展
- 2024年
- 拉曼光谱技术是一种无损、高灵敏的分子成分检测技术,近年来在众多领域得到广泛应用,但由于逐点扫描的观测方式耗时较长,限制了在大面积样品拉曼扫描和成像中的应用。线扫式拉曼光谱通过线形激发光照明、同步采集线形样本区域拉曼信号的方式,相对于点扫式拉曼光谱仪成像速率获得了若干数量级的提升,从而使大面积、大数量样本具有时效性的拉曼光谱观测成为可能。本文对线扫式拉曼光谱仪的原理、搭建方式、系统结构和特点做了简要介绍,综述了其在细胞、组织观测等方面的应用进展,并对线扫式拉曼光谱性能改进及功能拓展技术进行了展望。
- 李逸凡李小强李小强胡慧杰胡慧杰
- 关键词:拉曼光谱细胞成像生物医学
- 组网雷达估测降水系统并行化方案的设计与实现
- 国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量。同时,对实时性要求较高。如果可以缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序...
- 吴石磊安虹李小强
- 关键词:并行性分析降水系统
- 图广度优先搜索算法面向图形处理器的优化方法研究被引量:2
- 2014年
- 近年来,图形处理器(GPU)以其丰富的计算资源和低廉的成本逐渐在高性能计算领域取得一席之地,对于具有规则访存特性的并行程序具有明显的加速作用.但是以图广度优先搜索(BFS)算法为代表的某些不规则应用,在图形处理器上性能表现平平.为了解决不规则程序在图形处理器上的性能瓶颈问题必须分析其行为特征,面向特定体系结构提出有针对性的程序优化方法.本文通过分析图广度优先搜索算法的在GPU上的并行性模式,访存特性以及工作负载,提出了基于并行性剖析与反馈的计算资源重配置方法,动态队列的层次优化方法,以及线程级负载平衡方法.实验表明以上优化方法能够显著提高图广度优先搜索算法为代表的不规则程序在GPU上的性能.
- 刘谷安虹李小强吴石磊
- 关键词:图形处理器