-
王向前
-

-

- 所属机构:中国电子科技集团公司第三十八研究所
- 所在地区:安徽省 合肥市
- 研究方向:自动化与计算机技术
- 发文基金:国家科技重大专项
相关作者
- 王昊

- 作品数:51被引量:86H指数:5
- 供职机构:中国科学技术大学
- 研究主题:MAPREDUCE 分簇 多核集群 数字信号处理器 催化
- 郑启龙

- 作品数:100被引量:193H指数:6
- 供职机构:中国科学技术大学计算机科学与技术学院
- 研究主题:DSP MAPREDUCE 分簇 数字信号处理器 超长指令字
- 洪一

- 作品数:127被引量:304H指数:11
- 供职机构:中国电子科技集团公司第三十八研究所
- 研究主题:数字信号处理器 雷达 信号处理 处理器 双基地雷达
- 项利萍

- 作品数:13被引量:5H指数:1
- 供职机构:中国电子科技集团公司第三十八研究所
- 研究主题:寄存器 谓词 扁平化 分簇结构 灵活度
- 郭二辉

- 作品数:58被引量:41H指数:3
- 供职机构:中国电子科技集团公司第三十八研究所
- 研究主题:数字信号处理器 控制寄存器 处理器 标志位 高速缓冲存储器
- HPCC在IBM刀片机群上的诊断测试与结果分析
- 2009年
- 在IBMJS21 Blade Center上进行2次HPCC测试,介绍HPCC的结果分析方法,并采用分层模型AHPCC对HPCC的测试结果进行分析。其目的是通过在高性能机群上执行HPCC测试说明HPCC测试对机群系统的评价和诊断能力。实验发现,在之前的HPL测试结果一直不理想并且无法更进一步发现和解决问题的情况下,采用HPCC测试能够较好地评价系统和诊断系统问题。通过分层模型的评价,能够得到更多关于目标系统的性能参数和发现可能的性能瓶颈,为系统设计及构建积累有价值的经验。
- 王宣强王向前张云泉
- 一种面向数字信号处理器的多谓词控制及编译优化方法
- 本发明涉及一种面向数字信号处理器的多谓词控制及编译优化方法,多谓词控制指令格式为:(p(1),p(2),…,p(n))Rs=Rm op Rn,含义为p(1),p(2),…,p(n),n>=1,n个控制谓词都为真时,...
- 王向前王昊项利萍郭二辉洪一孙立宏
- 文献传递
- 分块内存的数据分布优化被引量:1
- 2015年
- 为了提高访存效率,提供可以与计算流水线并行执行的多个独立的访存流水线,魂芯DSP片上存储器设计时采用分块内存结构,并在核内提供多个独立的地址生成单元用于访存操作.针对分块内存的结构特点,编译器对程序中的存储访问构建关于变量的冲突图,对分块内存进行存储块分配,优化数据在分块内存的分布.以数据在分块内存的优化分布为基础,指导程序中访存操作在地址生成单元的优化分配,使得编译器生成的代码可以最大程度地挖掘程序中数据访问的并行性.实验表明,基于分块内存的数据分配分布优化为其它优化如地址寄存器的分簇、访存向量化、软件流水等经典优化提供了良好基础,保证了编译器生成的代码可以充分发挥魂芯DSP提供的指令级并行能力.
- 王向前洪一郑启龙
- 关键词:数据分布
- HPMR内存管理模块优化设计
- 2011年
- HPMR系统是一个采用MapReduce模型的高性能计算软件支撑平台,它改进了MapReduce模型以适应高性能计算的需求。高效的HPMR系统内存管理模块是保证其效率的重要模块。HPMR系统中有两个角色,Master和Worker。Master负责从输入数据文件中读入数据块并分配给Workers。Worker负责接收master分配的数据块、管理map函数的输入输出模块的输入输出数据、管理reduce函数输入输出数据。目前的内存管理模块存在管理通信冗余、管理低效、数据处理并行不足等缺点。本文根据成熟的内存优化理论,重新设计了HPMR底层的数据管理机制,提出了基于内存池的内存管理。实验表明,新的内存管理模块是保证HPMR系统高效的必要条件。
- 郑启龙汪睿王向前
- 关键词:MAPREDUCE内存池数据管理
- 面向BWDSP100的编译基础设施扩展研究
- 2014年
- BWDSP100是一款采用16发射、SIMD、VLIW架构的32位高性能DSP,适用于雷达信号处理、电子对抗、通信及图像处理等领域。对这种体系结构,编译器是发挥其高性能的关键因素。本文针对在Openimpact编译基础设施基础上开发BWDSP100编译器过程中遇到的一些关键技术加以讨论,并对Openimpact对多簇BWDSP100的支持进行了扩展。
- 王昊王向前
- 关键词:分簇指令调度
- 面向高数据并行架构的原位 FFT 算法
- 2015年
- 数字信号处理器的内存较小,而且数字信号处理领域的应用往往是数据密集型,这要求在设计数字信号处理应用算法时既要考虑时间复杂度又要兼顾算法的空间复杂度.为此提出了一种原位的逆序算法;针对数字信号处理器比较高的内存访问并行度,设计了部分逆序的原位高效FFT算法;并在魂芯DSP平台上实现了该算法框架.实验表明,与非原位FFT算法相比,该原位算法的空间复杂度大幅降低而时间效率的损失在可接受范围之内.
- 王向前郑启龙王昊洪一张磊
- 关键词:逆序原位FFT空间复杂度时间复杂度
- 并行计算模型参数动态分析软件包设计
- 2009年
- 并行计算模型的发展引入越来越多的模型参数。对并行计算模型参数动态采集分析软件包DEMPAT的整体框架进行研究,实现基于硬件性能计数器的存储层次参数采集模块。实验表明,该模块能够准确快速地获取存储层次参数且具有较好的可移植性。
- 王向前张云泉侯晓吻
- 关键词:并行计算模型
- 一种平衡的全局指令调度新框架研究
- 2014年
- 全局指令调度可以分为结构驱动和剖析驱动两类。我们展示了一种新算法,尝试结合以上两类方法各自的特点,同时避免它们的一些缺点。该算法可以在寄存器分配之前和之后调用,它已经在Open64编译器上实现,其结果在BWDSP100处理器上得到了评估。
- 王昊王向前
- 高性能MapReduce系统的优化
- 近年来,以多核集群为主流架构的高性能计算机成为高性能计算的主要硬件支撑平台。而共享变量和消息传递是最常用的两类并行编程模型。但其对并行的描述与表达层次较低。开发者在使用它们时,必须花费许多时间和精力来熟悉并显式地使用它们...
- 王向前
- 关键词:内存池
- 文献传递
- 一种分簇结构的部分谓词实现及编译优化方法
- 本发明涉及一种分簇结构的部分谓词实现及编译优化方法,包括通过数据总线与各个片上内存进行双向通讯的计算簇X簇、Y簇、Z簇和T簇,以及通过地址总线与各个片上内存进行双向通讯的地址簇U簇、V簇和W簇,在X簇、Y簇、Z簇和T簇上...
- 王向前王昊项利萍孙立宏洪一
- 文献传递