范东睿
- 作品数:265 被引量:209H指数:8
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学政治法律更多>>
- 嵌入式处理器中降低Cache缺失代价设计方法研究被引量:3
- 2006年
- 以龙芯1号处理器为研究对象,探讨了嵌入式处理器中降低Cache缺失代价的设计方法.通过分析处理器的结构特征,本文实现了在关键字优先基础上一次缺失下命中的非阻塞数据Cache,可以将处理器平均性能提高3.9%.同时利用局部性原理,在关键字优先非阻塞数据Cache的基础上,本文提出了一种类非阻塞的指令Cache设计方法,可以降低指令Cache的缺失代价,以较小的实现代价进一步将处理器平均性能提高7.7%.通过本文的工作,可以同时降低指令Cache和数据Cache的缺失代价,处理器的平均性能提高了11.6%.
- 黄海林许彤范东睿唐志敏
- 关键词:嵌入式处理器CACHE
- H.264去块滤波算法在众核结构上的并行优化被引量:2
- 2011年
- 在H.264视频解码中,去块滤波是运算量很大的一部分.由于去块滤波过程中,数据之间存在复杂的依赖性,现有的很多去块滤波并行方案存在着并行度小、同步互斥开销大的缺点.本文结合去块滤波算法及众核处理器Godson-T的结构特性,提出了一种可以减少数据依赖的去块滤波算法并行优化方案.相对于以前的很多方法,此并行方案首先在算法上增大了并行度,减少了同步开销,同时,我们通过片上众核处理器Godson-T的硬件支持,采用计算与通信重叠等优化策略,使得优化后的算法达到了数倍的性能提升.
- 范灵俊颜成钢宋风龙马宜科范东睿
- 关键词:H.264去块滤波
- 一种ECDSA算法执行系统及方法
- 本发明提供一种ECDSA算法执行系统及方法,主机端通过数据流芯片进行加密和解密操作,通过网络传输加密信息。本发明相比于现有技术,通过将ECDSA算法移植到数据流架构芯片上,利用了数据流架构芯片低访存需求的特点,加快了EC...
- 范志华秦宏吴欣欣李文明安学军叶笑春范东睿
- 文献传递
- 自动检测除尘装置及除尘机箱
- 提供一种自动检测除尘装置,包括:光源,用于发射探测光;透镜,用于接收所述探测光,并发出平行光;第一光电探测器,用于接收并检测来自所述透镜的光;吸尘装置,用于吸收粉尘;除尘控制板,其被设置用于接收所述第一光电探测器的检测信...
- 李妍郝沁汾叶笑春范东睿
- 满足SystemC语法要求的多核处理器及获得其执行代码的方法
- 本发明公开了一种满足SystemC语法要求的多核处理器及获得其执行代码的方法。该多核处理器包括:多个用于交换数据的交换单元连接形成的阵列,多个用于数据处理的处理单元与所述交换单元连接;连接在相邻的所述处理单元之间的用于相...
- 陈曦范东睿张浩
- 文献传递
- PartitionSim:一个面向众核结构的并行模拟器被引量:2
- 2011年
- 该文提出了一个面向众核处理器的并行模拟器:PartitionSim.PartitionSim采用了一种新颖的方法——时序分割来加速众核结构模拟.时序分割的提出基于这样的观察:在众核结构中,有些模块之间频繁交互而有的模块之间没有交互.有鉴于此,该方法将目标结构分割成两部分:交互部分和非交互部分.当模拟交互部分时,主机线程严格同步,维持时序精确.当模拟非交互部分时,主机线程通过异步运行,提高模拟速度,并且产生较小的时序损失.文中所述工作在一个16核的SMP机器上用PartitionSim模拟了千核规模的Godson-T众核结构.实验结果显示,PartitionSim展示出良好的加速比,达到最高25MIPS的模拟速度,时序损失平均值为0.92%.
- 焦帅徐卫志唐士斌范东睿孙凝晖
- 光电转换装置、计算机主板及计算机主机
- 本发明公开了一种光电转换装置、计算机主板及计算机主机。光电转换装置包括:基板、光收发芯片及电芯片;光收发芯片和电芯片设置并连接于基板,光收发芯片与光纤连接,光收发芯片和电芯片通过基板相连接。将光电转换装置设置于计算机主板...
- 张强郝沁汾叶笑春范东睿
- 文献传递
- 一种众核系统的任务管理方法和装置
- 本发明提供一种众核系统的任务管理方法和装置,涉及计算机领域,能够在众核系统中通过任务管理装置进行系统任务的调度管理,提高了众核系统进程管理效率。其方法为:当需要将进程加入到任务链表中,则将该进程的进程描述符指针添加到该进...
- 张轮凯范东睿张浩叶笑春
- 文献传递
- 提升稀疏目录缓存一致性系统性能的方法被引量:3
- 2014年
- 稀疏目录技术在缓存一致性非一致存储访问(cache coherent non-uniform memory access,ccNUMA)系统中有广泛应用.但是,稀疏目录技术的一个主要缺陷在于目录项替换在目录热点存在的情况下会严重降低系统的性能.针对此问题,研究如何提升稀疏目录性能.首先,从定性和定量的角度对主流的稀疏目录替换算法进行了分析,并且发现最为原始的最久未使用(least-recent-used,LRU)算法的性能实际上要优于一些近期提出的目录替换算法,如最少共享者(least-sharer-count,LSC)算法.其次,将victim cache的思想应用到稀疏目录上,提出了victim目录(victim directory),该技术在主稀疏目录模块上加入了一个小的全相联二级目录存储.最后,提出了选择性victim目录(selective victim directory)技术,使得victim目录选择性地仅存储有用的目录项,从而进一步减少了目录替换的数量.选择性victim目录通过向所有节点的cache发出探查消息(probe messages),从而选择性地存储较为有用的目录项.实验证明,选择性victim目录取得了比简单victim目录更好的性能;而且在仅增加了1KB左右的硬件开销的代价下,选择性victim目录节省了35.7%的程序运行时间.
- 张轮凯宋风龙王达范东睿孙凝晖
- RISC处理器中执行寄存器类型指令的方法和其系统
- 本发明涉及RISC处理器中执行寄存器类型指令的方法和系统,方法包括:步骤1,发现汇编代码中寄存器类型指令在执行时,所用类型寄存器的可用数目不足,则生成所述寄存器类型指令对应的宏指令,使用所述宏指令代替所述寄存器类型指令;...
- 安述倩余磊张浩范东睿
- 文献传递