公共文化服务平台

STTAR: A Traffic- and Thermal-Aware Adaptive Routing for 3D Network-on-Chip Systems: 2022年; Since the three-dimensional Network on Chip(3D NoC)uses through-silicon via technology to connect the chips,each silicon layer is conducted through heterogeneous thermal,and 3D NoC system suffers from thermal problems.To alleviate the seriousness of the thermal problem,the distribution of data packets usually relies on traffic information or historical temperature information.However,thermal problems in 3D NoC cannot be solved only based on traffic or temperature information.Therefore,we propose a Score-Based Traffic-and Thermal-Aware Adaptive Routing(STTAR)that applies traffic load and temperature information to routing.First,the STTAR dynamically adjusts the input and output buffer lengths of each router with traffic load information to limit routing resources in overheated areas and control the rate of temperature rise.Second,STTAR adopts a scoring strategy based on temperature and the number of free slots in the buffer to avoid data packets being transmitted to high-temperature areas and congested areas and to improve the rationality of selecting routing output nodes.In our experiments,the proposed scoring Score-Based Traffic-and Thermal-Aware Adaptive Routing(STTAR)scheme can increase the throughput by about 14.98%to 47.90%and reduce the delay by about 10.80%to 35.36%compared with the previous works.; Juan FangYunfei MaoMin CaiLi’ang ZhaoHuijie ChenWei Xiang; 关键词：THERMAL

Heterogeneous Multiprocessor Matching Degree Scheduling Algorithm Based on OpenCL Framework: In a heterogeneous multi-core system, the merits of the task scheduling algorithm have a great impact on the e...; Juan FangTingwen YuZelin Wei

边云协同场景下基于强化学习的精英分层任务卸载策略研究被引量：1: 2022年; 随着5G的发展以及应用程序功能的丰富,应用程序对终端设备的计算能力提出了更高的要求,为了提高终端设备对应用程序的计算能力,降低任务的处理时间,针对移动边缘计算环境,提出了一种边云协同的任务卸载方式,并设计了基于强化学习的精英分层进化算法(RL-EHEA,elite hierarchical evolutionary algorithm combined with reinforcement learning)进行卸载决策,使多个具有依赖关系与截止时间的任务对计算资源竞争。结果表明,与遗传算法(GA,genetic algorithm)和精英遗传算法(EGA,elite genetic algorithm)相比,RL-EHEA能缩短任务的处理时间,得到更优的资源分配策略。; 方娟叶志远张梦媛史佳眉滕自怡; 关键词：进化算法

基于目标检测网络的动态场景下视觉SLAM优化被引量：6: 2022年; 为了降低动态环境对同时定位与建图(simultaneous localization and mapping,SLAM)位姿估计的干扰,提出一种将目标检测网络与ORB-SLAM2系统结合的方法.在帧间估计阶段,使用目标检测网络获取当前帧的语义信息,得到潜在可移动物体边界框,结合深度图像并根据最大类间方差算法分割出边界框内前景,把落在前景中的动态特征点剔除,利用剩下的特征点估计位姿.在回环检测阶段,利用边界框构建图像语义特征,并与历史帧比较,查询相似关键帧,与视觉词袋法相比,该方法查询速度快,内存占用少.在TUM Techni数据集上进行测试,结果表明该方法可以有效提高ORB-SLAM2在高动态场景中的性能.; 方娟方振虎; 关键词：目标检测图像分割位姿估计

DI＿GA: A Heuristic Mapping Algorithm for Heterogeneous Network-on-Chip: Heterogeneous multi-core processors have become the forefront of processor development due to their advantages...; Juan FangHuan ZongHaoyan Zhao

基于异构多核的LLC缓冲管理策略被引量：1: 2019年; 针对异构多核架构下,大量共享末级缓存(last level cache,LLC)空间被GPU应用程序占据,导致系统性能降低的问题,提出了一种基于异构多核的LLC缓冲管理策略buffer-for-GPU(BFG).该策略在共享末级缓存旁侧建立一个与其结构相同的缓冲buffer,缓存不敏感GPU消息直接访问buffer而不访问LLC.针对CPU应用程序和GPU应用程序不同的特性,采用合理的替换策略,增加cache命中率.结果表明:BFG使CPU和GPU每一时钟周期内所执行的指令数(instruction per cycle,IPC)分别平均提升2. 48%和9. 30%,CPU应用程序命中率平均提升70. 45%. BFG可以有效地过滤GPU请求,为CPU应用程序腾出LLC空间,从而提高系统性能.; 方娟张希蓓刘士建; 关键词：异构多核缓存管理

基于负载均衡的CPU-GPU异构计算平台任务调度策略被引量：5: 2020年; 针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计算能力,将计算任务按照探测比例分配给CPU和GPU;将并行任务存入双向队列,以降低调度带来的额外开销.结果表明,使用该策略的基准测试程序系统性能平均提升了28.07%.总体而言,该调度策略能够缩短CPU与GPU完成各自计算任务后的等待时间,有效平衡系统CPU与GPU之间的负载,提升系统性能.; 方娟章佳兴; 关键词：异构计算任务调度负载均衡

一种基于Inter-warp异构性的缓存管理与内存调度机制: 2019年; 在GPU中,一个warp内的所有线程在锁步中执行相同的指令。某些线程的内存请求可以得到快速处理,而其余请求会经历较长时间。在最慢的请求完成之前,warp不能执行下一条指令,导致内存发散。对GPU中warp间的异构性进行了研究,实现并优化了一种基于inter-warp异构性的缓存管理机制和内存调度策略,以减少内存发散和缓存排队延迟的负面影响。根据缓存命中率将warp分类,以驱动后面的3个组件:(1)基于warp类型的缓存旁路技术组件,使低缓存利用率的warp进入旁路,不访问L2缓存;(2)基于warp类型的缓存插入/提升策略组件,防止来自高缓存利用率warp的数据被过早清除;(3)基于warp类型的内存控制器组件,优先处理从高缓存利用率的warp接收到的请求,并优先处理来自相同warp的请求。基于warp间异构性的缓存管理和内存调度机制在8种不同的GPGPU应用中,与基准GPU相比,平均加速18.0%。; 方娟魏泽琳于婷雯; 关键词：缓存管理

多核处理器可重构Cache功耗计算方法的研究被引量：1: 2014年; 多核动态可重构Cache是解决Cache功耗困扰的一个重要方法。现有Cache功耗模拟器并不能很好地支持多核动态可重构Cache功耗研究,通过对多核动态可重构Cache的功耗模型进行研究,找到了计算可重构Cache的方法和思路,应用CACTI来分别构建各个组成结构的Cache功耗模型,以较为准确地测算可重构Cache的功耗。在Simics模拟器下构建动态可重构Cache,运行测试程序,对比传统的体系结构,可重构Cache的功耗能够得到10.4%的降低。同时,实验中发现功耗的降低不仅仅是动态可重构Cache贡献的,而是由系统综合产生的,因此在低功耗设计中,要综合考虑整体系统的功耗和性能,避免片面地考虑Cache结构而导致整体功耗的提高。; 方娟陈欣; 关键词：多核处理器 CACHE 功耗

面向低功耗的多核处理器Cache设计方法被引量：2: 2013年; 针对多核处理器下的共享二级缓存(L2 Cache)提出了一种面向低功耗的Cache设计方案(LPD)。在LPD方案中,分别通过低功耗的共享Cache混合划分算法(LPHP)、可重构Cache算法(CRA)和基于Cache划分的路预测算法(WPP-L2)来达到降低Cache功耗的目的,同时保证系统的性能良好。在LPHP和CRA中,程序运行时动态地关闭Cache中空闲的Cache列,节省了对空闲列的访问功耗。在WPP-L2中,利用路预测技术在Cache访问前给出预测路信息,预测命中时则可用最短的访问延时和最少的访问功耗完成Cache访问;预测失效时,则结合Cache划分策略,降低由路预测失效导致的额外功耗开销。通过SPEC2000测试程序验证,与传统使用最近最少使用(LRU)替换策略的共享L2 Cache相比,本方案提出的三种算法虽然对程序执行时间稍有影响,但分别节省了20.5%、17%和64.6%的平均L2 Cache访问功耗,甚至还提高了系统吞吐率。实验表明,所提方法在保持系统性能的同时可以显著降低多核处理器的功耗。; 方娟郭媚杜文娟雷鼎; 关键词：片上多核处理器二级缓存低功耗

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(61202076)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(61202076)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈