您的位置: 专家智库 > >

张轮凯

作品数:8 被引量:8H指数:2
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划创新研究群体科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇专利
  • 3篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 6篇处理器
  • 5篇缓存
  • 4篇多核
  • 3篇高速缓存
  • 2篇硬件
  • 2篇硬件资源
  • 2篇相关数据
  • 2篇末级
  • 2篇结点
  • 2篇缓存数据
  • 2篇寄存器
  • 2篇共享
  • 2篇核结构
  • 2篇LFU
  • 2篇存储资源
  • 1篇动态功耗
  • 1篇选择性
  • 1篇组相联
  • 1篇无效
  • 1篇系统性能

机构

  • 8篇中国科学院
  • 2篇中国科学院研...
  • 1篇中国科学院大...

作者

  • 8篇张轮凯
  • 5篇范东睿
  • 3篇张浩
  • 3篇宋风龙
  • 2篇雷峥蒙
  • 2篇马啸宇
  • 2篇李海忠
  • 2篇王达
  • 2篇包尔固德
  • 1篇王达
  • 1篇孙凝晖
  • 1篇唐士斌
  • 1篇郑亚松
  • 1篇范灵俊

传媒

  • 1篇计算机研究与...
  • 1篇计算机应用与...
  • 1篇小型微型计算...
  • 1篇2012中国...

年份

  • 1篇2014
  • 2篇2013
  • 2篇2012
  • 1篇2011
  • 1篇2010
  • 1篇2008
8 条 记 录,以下是 1-8
排序方式:
一种针对片上众核结构共享末级缓存的改进的LFU替换算法
为了得到更高的吞吐率和性能功耗比,众核处理器 (Manycore Processor) 摒弃了复杂的乱序处理器核,而在芯片内集成了大量的轻量级顺序处理器核。为了更好地支持核间数据共享,并减少访问片外存储器带来的开销,众核...
张轮凯宋风龙王达
提升稀疏目录缓存一致性系统性能的方法被引量:3
2014年
稀疏目录技术在缓存一致性非一致存储访问(cache coherent non-uniform memory access,ccNUMA)系统中有广泛应用.但是,稀疏目录技术的一个主要缺陷在于目录项替换在目录热点存在的情况下会严重降低系统的性能.针对此问题,研究如何提升稀疏目录性能.首先,从定性和定量的角度对主流的稀疏目录替换算法进行了分析,并且发现最为原始的最久未使用(least-recent-used,LRU)算法的性能实际上要优于一些近期提出的目录替换算法,如最少共享者(least-sharer-count,LSC)算法.其次,将victim cache的思想应用到稀疏目录上,提出了victim目录(victim directory),该技术在主稀疏目录模块上加入了一个小的全相联二级目录存储.最后,提出了选择性victim目录(selective victim directory)技术,使得victim目录选择性地仅存储有用的目录项,从而进一步减少了目录替换的数量.选择性victim目录通过向所有节点的cache发出探查消息(probe messages),从而选择性地存储较为有用的目录项.实验证明,选择性victim目录取得了比简单victim目录更好的性能;而且在仅增加了1KB左右的硬件开销的代价下,选择性victim目录节省了35.7%的程序运行时间.
张轮凯宋风龙王达范东睿孙凝晖
一种片上共享高速缓存的替换装置和方法以及相应处理器
本发明提供一种片上共享高速缓存的替换装置和方法以及相应处理器,该装置包括局部性打分模块和替换选择模块,其中:所述局部性打分模块包括多个打分寄存器,所述打分寄存器用于存储缓存块地址和所述缓存块地址的分数;所述局部性打分模块...
张轮凯李海忠雷峥蒙张浩范东睿
一种多核或众核处理器功能验证设备及方法
本发明提供一种多核或众核处理器功能验证设备,包括重复逻辑电路、片上存储以及其它逻辑电路;重复逻辑电路包括用于模拟多核或众核处理器中的各个结点的复用结点、用于对复用结点的功能验证过程进行控制的控制模块和用于存储与所述复用结...
马啸宇范东睿包尔固德张轮凯
文献传递
一种带有无效缓存路访问过滤机制的低功耗高速缓存
2012年
功耗是当今处理器设计领域的重要问题之一.随着多核处理器的普及,片上缓存占有了越来越多的芯片面积和功耗.提出一种带有无效缓存路访问过滤机制的低功耗高速缓存结构来降低CPU的动态功耗,具体为,通过无效缓存块的预先检查(Pre-Invalid Way Checking,PIWC)消除对无效缓存路的访问,及通过不匹配缓存路的预先检测(Pre-Mismatch Way Detecting,PMWD)消除对tag低位不匹配缓存路的访问.对实际程序的测试表明,65.2%-88.9%缓存路的无效访问可以通过以上方法被消除,约60.9%-85.6%由缓存访问带来的动态能耗从而被降低.同时,跟tag-data顺序访问方法相比,对于大多数程序,我们的方法可以获得5.1%-13.8%的节能效果提升.
范灵俊唐士斌张轮凯郑亚松张浩
关键词:动态功耗
一种多核或众核处理器功能验证设备及方法
本发明提供一种多核或众核处理器功能验证设备,包括重复逻辑电路、片上存储以及其它逻辑电路;重复逻辑电路包括用于模拟多核或众核处理器中的各个结点的复用结点、用于对复用结点的功能验证过程进行控制的控制模块和用于存储与所述复用结...
马啸宇范东睿包尔固德张轮凯
文献传递
一种针对片上众核结构共享末级缓存的改进的LFU替换算法被引量:5
2013年
为了得到更高的吞吐率和性能功耗比,众核处理器摒弃了复杂的乱序处理器核,而在芯片内集成了大量的轻量级顺序处理器核。为了更好地支持核间数据共享,并减少访问片外存储器带来的开销,众核处理器往往采用共享的末级缓存LLC(Last LevelCache)。因为需要对为数众多相对独立的访问请求作出响应,因此相对于传统多核处理器的末级片内缓存,众核处理器的末级片内缓存更容易产生抖动现象。传统的最久未使用LRU(Least Recent Used)高速缓存替换策略在这种情况下往往无能为力,而几种最新提出的高速缓存替换策略也见效甚微。基于传统的最不经常使用LFU(Least Frequent Used)替换算法,提出一种改进的高速缓存替换算法。相对于LFU替换算法,该算法获取信息的粒度更粗,并且可以掌握更加全局的信息,而这些优势使得该算法更适合作为众核处理器末级片内缓存的替换算法。实验结果表明,在一个64核的众核处理器上,该替换算法可以有效地缓解末级片内缓存的抖动现象,同时该算法实现需要的硬件开销很小。
张轮凯宋风龙王达
一种片上共享高速缓存的替换装置和方法以及相应处理器
本发明提供一种片上共享高速缓存的替换装置和方法以及相应处理器,该装置包括局部性打分模块和替换选择模块,其中:所述局部性打分模块包括多个打分寄存器,所述打分寄存器用于存储缓存块地址和所述缓存块地址的分数;所述局部性打分模块...
张轮凯李海忠雷峥蒙张浩范东睿
文献传递
共1页<1>
聚类工具0