北京市教委科技计划面上项目(KM201210005022) 作品数:6 被引量:5 H指数:1 相关作者: 方娟 郭媚 杜文娟 王帅 雷鼎 更多>> 相关机构: 北京工业大学 更多>> 发文基金: 国家自然科学基金 北京市教委科技计划面上项目 北京市属高等学校中青年骨干人才培养计划 更多>> 相关领域: 自动化与计算机技术 更多>>
无缓存片上网络中偏转感知的拥塞控制方法 被引量:1 2015年 针对现有工作仅对高网络密集度应用的注入率进行调控,无法精确地控制网络拥塞的问题,提出一种偏转感知的拥塞控制方法——DAT.该方法使用分布式的偏转监控表来追踪网络中偏转数据包的分布,从而快速准确地确定拥塞源;并结合网络利用率确定拥塞源向网络中注入数据包的速率,以达到缓解网络拥塞提高网络整体性能的目的.在16核仿真平台上对DAT方法的评测结果显示,相比于基准无缓存No C,文中方法可以将网络偏转率平均降低8.6%,并且具有良好的可扩展性和较低的硬件开销. 方娟 姚治成关键词:多核 片上网络 拥塞控制 多核处理器可重构Cache功耗计算方法的研究 被引量:1 2014年 多核动态可重构Cache是解决Cache功耗困扰的一个重要方法。现有Cache功耗模拟器并不能很好地支持多核动态可重构Cache功耗研究,通过对多核动态可重构Cache的功耗模型进行研究,找到了计算可重构Cache的方法和思路,应用CACTI来分别构建各个组成结构的Cache功耗模型,以较为准确地测算可重构Cache的功耗。在Simics模拟器下构建动态可重构Cache,运行测试程序,对比传统的体系结构,可重构Cache的功耗能够得到10.4%的降低。同时,实验中发现功耗的降低不仅仅是动态可重构Cache贡献的,而是由系统综合产生的,因此在低功耗设计中,要综合考虑整体系统的功耗和性能,避免片面地考虑Cache结构而导致整体功耗的提高。 方娟 陈欣关键词:多核处理器 CACHE 功耗 面向低功耗共享Cache路适应划分算法研究 2014年 如何提高多核处理器的性能和降低多核处理器中Cache的功耗已经成为下一代多核处理器的研究热点。为了降低片上多核处理器的功耗,基于路适应算法可以采用一种新的动态划分机制,该机制主要由路分配模块和动态功耗控制模块组成。路分配模块在程序运行过程中根据处理器核所运行线程的工作集的大小调整处理器核所分配的Cache路。动态功耗控制模块利用程序运行的局部性原理,将处理器核所运行线程的工作空间控制在少数Cache路中。关闭剩余的Cache路,从而达到降低Cache功耗的目的。该机制使用Simics全系统模拟平台模拟多核处理器,并用SpecOMP测试集测试了系统的性能和功耗。与传统的Cache(Conventional L2Cache,C-L2)相比,其IPC提高了9.27%,功耗降低了10.95%。 方娟 王帅 于璐关键词:低功耗 面向低功耗的多核处理器Cache设计方法 被引量:2 2013年 针对多核处理器下的共享二级缓存(L2 Cache)提出了一种面向低功耗的Cache设计方案(LPD)。在LPD方案中,分别通过低功耗的共享Cache混合划分算法(LPHP)、可重构Cache算法(CRA)和基于Cache划分的路预测算法(WPP-L2)来达到降低Cache功耗的目的,同时保证系统的性能良好。在LPHP和CRA中,程序运行时动态地关闭Cache中空闲的Cache列,节省了对空闲列的访问功耗。在WPP-L2中,利用路预测技术在Cache访问前给出预测路信息,预测命中时则可用最短的访问延时和最少的访问功耗完成Cache访问;预测失效时,则结合Cache划分策略,降低由路预测失效导致的额外功耗开销。通过SPEC2000测试程序验证,与传统使用最近最少使用(LRU)替换策略的共享L2 Cache相比,本方案提出的三种算法虽然对程序执行时间稍有影响,但分别节省了20.5%、17%和64.6%的平均L2 Cache访问功耗,甚至还提高了系统吞吐率。实验表明,所提方法在保持系统性能的同时可以显著降低多核处理器的功耗。 方娟 郭媚 杜文娟 雷鼎关键词:片上多核处理器 二级缓存 低功耗 一种基于频率的多核共享Cache替换算法 被引量:1 2014年 LRU替换算法在单核处理器中得到了广泛应用,而多核环境大都采用多核共享最后一级Cache(LLC)的策略,随着LLC容量和相联度的增加以及多核应用的工作集增大,LRU替换算法和理论最优替换算法之间的差距越来越大。该文提出了一种平均划分下基于频率的多核共享Cache替换算法(ALRU-F)。该算法将当前所需要的部分工作集保留在Cache内,逐出无用块,同时还提出了块粒度动态划分下基于频率的替换算法(BLRU-F)。该文提出的ALRU-F算法相比传统的LRU算法缺失率降低了26.59%,CPU每一时钟周期内所执行的指令数IPC(Instruction Per Clock)则提升了13.59%。在此基础上提出的块粒度动态划分下,基于频率的BLUR-F算法相比较传统的LRU算法性能提高更大,缺失率降低了33.72%,而IPC则提升了16.59%。提出的两种算法在性能提升的同时,并没有明显地增加能耗。 方娟 李成艳 王帅 姚治成关键词:多核处理器 共享CACHE WPP-L2:多核处理器中共享Cache低功耗路预测算法 2013年 针对片上多核处理器下的二级共享Cache的能耗问题提出了基于Cache划分的路预测Cache结构WPP-L2,该结构首先对共享Cache进行公平性划分,然后采用路预测的方法降低了预测命中和失效时各自的能耗开销。实验表明,在基本保持多核处理器性能的同时,8核处理器系统下WPP-L2Cache比基于路预测的L2Cache的能耗延迟乘积EDP(Energy Delay Product)平均下降24.7%,比传统的L2Cache的EDP平均下降66.1%,极大地降低了L2Cache功耗。 方娟 郭媚 杜文娟关键词:多核处理器 低功耗