国家科技重大专项(2009ZX01028-002-003)
- 作品数:5 被引量:34H指数:4
- 相关作者:汪文祥胡伟武吴瑞阳刘刚蔡晔更多>>
- 相关机构:龙芯中科技术有限公司中国科学院中国科学院大学更多>>
- 发文基金:国家科技重大专项国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于RAM的降低异构多核切换开销的方法
- 同一程序的不同执行阶段或者不同程序运行时行为特征不同.异构多核处理器包含多种类型处理器核,可以根据程序运行时的行为特征切换到性能、功耗合适的核.异构多核相对于同构多核处理器能够更好地满足性能和功耗要求,但是不同核间切换时...
- 刘奇郝守青沈海华章隆兵
- 关键词:寄存器重命名
- 文献传递
- 龙芯3A平台Vxworks移植的研究和实现被引量:6
- 2012年
- 龙芯3A处理器具有高性能低功耗的优点,在高性能计算、个人桌面应用、工业控制、高性能嵌入式等领域都有广阔的应用前景.目前龙芯系列平台大都是基于Linux系统,但在工业控制、高性能嵌入式等领域,高实时性和高可靠性的VxWorks才是比较理想的选择.在分析了VxWorks移植的主要内容基础上,详细研究了龙芯3A的VxWorks移植方法.针对具体工业应用,设计了一种基于龙芯3A的工控平台,并实现了对该平台的VxWorks移植.经过在龙芯3A开发板上的验证是可行的.
- 王雷樊晓桠王党辉
- 关键词:龙芯3AVXWORKS系统
- 用于多核同步优化的cache一致性协议设计
- 2013年
- 通过对多核同步过程中的访存行为进行分析,提出了一种识别同步类型的方法,并设计了一种实现同步优化的新的cache一致性协议。该协议增加了一个用于记录同步信息的cache状态,通过阻塞的方式可以让多个处理器核串行地完成同步操作,保证同步操作中原子指令能够顺利执行成功,从而大大减少由多核同步冲突引发的访存请求数量,将多核同步过程中的访存行为优化到了几乎最好的情况。实验结果表明,通过同步优化,这个新的cache一致性协议能够使多核同步的性能提升到接近最理想的结果。实验表明,相比传统的cache一致性协议,实验中采用的几个标准多核性能测试程序优化后的同步性能提升了1倍,而并行程序整体运行时间降低25%。
- 陈李维张广飞张广飞汪文祥王焕东
- 关键词:CACHE一致性协议
- 龙芯指令系统融合技术被引量:5
- 2015年
- 本文介绍了龙芯CPU的指令系统融合技术.龙芯CPU在兼容MIPS指令系统的基础上进行扩充,增加MIPS中不具备但X86和ARM具备的、对二进制翻译影响很大的核心功能,形成龙芯指令系统Loong ISA.在此基础上,通过软硬结合的二进制翻译,在龙芯CPU上运行X86和ARM的主流系统及应用,以弥补MIPS架构软件生态的不足.实验结果表明,通过软硬件协同优化,龙芯指令系统融合技术能够消除指令系统之间的壁垒,使得MIPS,X86,ARM等不同指令集的软件能够融合到统一的Loong ISA平台上,不加区别地高效运行.
- 胡伟武靳国杰汪文祥张晓春王焕东
- 关键词:龙芯CPU二进制翻译
- 龙芯GS464E处理器核架构设计被引量:15
- 2015年
- 龙芯GS464E是龙芯公司最新推出的高性能处理器核架构.在本文中,将介绍GS464E架构的核心特性.相比于之前的GS464架构,重点强化了访存性能和分支预测准确率,实现了MIPS DSP指令集和虚拟机支持,增大了处理器中各项队列的项数,并增大了Cache容量和TLB容量.访存子系统拥有3级Cache结构,每一级都采用LRU替换策略,可以支持多核缓存一致性协议.经过上述强化设计,GS464E处理器核已成为一个创新性的高性能处理器核架构.
- 吴瑞阳汪文祥王焕东胡伟武
- 关键词:多核处理器缓存一致性
- KD-90普及型个人高性能计算机系统设计与性能优化被引量:8
- 2013年
- 报道中国首台采用自主设计研制的龙芯3B 8核处理器的万亿次高性能计算机系统KD-90.该系统具有高计算密度、低功耗、低成本、低占地的特点,其应用SMP→CC-NUMA→Cluster 3级并行体系结构,采用通用协议与专用协议结合的互连网络硬件设计,实现了CC-NUMA机群架构关键技术的突破;应用矢量部件加速技术实现了一种通用处理器与向量协处理器相结合的编程模型.结合体系结构特点和操作系统内核对系统性能优化并进行了性能测试和分析.
- 蔡晔刘刚毛睿罗秋明陈国良
- 关键词:计算机工程龙芯