张科 作品数:35 被引量:20 H指数:3 供职机构: 中国科学院计算技术研究所 更多>> 发文基金: 国家自然科学基金 中国科学院战略性先导科技专项 更多>> 相关领域: 自动化与计算机技术 电子电信 文化科学 更多>>
面向图计算应用的处理器访存通路优化设计与实现 2020年 针对图计算应用的访存特点,提出并实现一种支持高并发、乱序和异步访存的高并发访存模块(High Concurrency and high Performance Fetcher,HCPF)。通过软-硬件协同的设计方法,HCPF可同时处理192条共8种类型的内存访问请求,且访存粒度可由用户定义,满足图计算应用对海量低延迟细粒度数据访问的需求。同时,HCPF扩展了基于内存语义的跨计算节点定制互连技术,支持远程内存的细粒度直接访问,为后续实现分布式图计算框架提供技术基础。结合上述两个核心研究内容,基于流水线RISC-V处理器核,设计并实现了可支持HCPF的RISC-V片上系统(System-on-Chip,SoC)架构,搭建基于FPGA的原型验证平台,并使用自研测试程序对HCPF进行初步性能评测。实验结果表明,HCPF相比原有访存通路,最高可将基于数组和随机地址的两种随机内存访问性能分别提升至3.5倍和2.7倍。远程内存直接访问4 Byte数据的延时仅为1.63μs。 张旭 常轶松 常轶松 陈明宇RISC-V技术及生态专题前言 被引量:1 2022年 从RISC-V指令集的诞生到现在已经历了10多个年头.国内的企业和科研机构也已从最开始的观望逐渐转变为主动接纳和积极推动这一新的开放体系架构. 武延军 宋威 张科 邢明杰关键词:指令集 RISC 外部设备扩展卡及输入输出外部设备的数据处理方法 本发明实施例提供一种外部设备扩展卡及输入输出外部设备的数据处理方法,该外部设备扩展卡包括:用于插设在主机的内存卡槽上的接口单元、内存单元、内存单元控制器、输入输出I/O外部设备、I/O外部设备控制器,可以通过接口单元直接... 常轶松 张科 崔泽汉 陈明宇文献传递 一种抽屉式高密度FPGA云平台机箱 本实用新型提出一种抽屉式高密度FPGA云平台机箱,包括:位于机箱底部的交换模块和位于交换模块上的供电模块以及位于供电模块上的抽屉结构;抽屉结构内设有控制板卡和FPGA节点板卡,FPGA节点板卡通过预设接口插接于控制板卡;... 张科 于磊 王亚洲 常轶松 赵然 陈明宇文献传递 FPGA加速仿真中内存行为确定性重放系统及方法 本发明提出一种FPGA加速仿真中内存行为确定性重放系统与方法。本发明设计了一种用于FPGA加速仿真的内存模型系统,并基于检查点技术和事务级确定性的保障方法精确保存目标系统中内存模型的事务级状态,无需考虑FPGA系统中物理... 常轶松 陈欲晓 张科 陈飞羽 齐乐 陈明宇 包云岗一种用于虚拟化环境中片上系统的DMA方法及系统 本发明提出一种用于虚拟化环境中片上系统的DMA方法和系统,包括:读主机内存‑写FPGA内存和读FPGA内存‑写主机内存两个方向的DMA硬件。以读主机内存‑写FPGA内存为例,主机运行的虚拟机发起访问FPGA内存指令,DM... 张科 阮金杰 常轶松 齐乐面向通用处理器芯粒架构探索和评估的系统级模拟器 2024年 随着摩尔定律的逐步失效,芯片制造工艺的提升愈发困难,芯片性能的提升面临“面积墙”问题,chiplet(芯粒)技术开始被广泛采用来解决此问题。然而,面向chiplet引入的架构设计参数,目前的体系结构模拟器面临新的挑战。为了能够探索chiplet架构的特定设计参数,现有工作通常只会为模拟器增加单一的功能,导致其难以用于探索多个参数对chiplet芯片的整体影响。为了能够较为全面地探索和评估chiplet芯片架构,该文基于现有gem5模拟器实现了面向通用处理器芯粒架构探索和评估的系统级模拟器(SEEChiplet)模拟器框架。首先,总结了现在chiplet芯片设计关注的3类设计参数,包括:(1)芯片cache系统设计;(2)封装方式模拟;(3) chiplet间的互连网络。其次,针对上述3类参数:(1)设计并实现了私有末级缓存系统,扩大了cache系统设计空间;(2)修改了gem5已有的全局目录,以适配私有末级缓存(LLC)系统;(3)建模了两种常见的chiplet封装方式以及chiplet间互连网络。最后,该文在SEEChiplet框架中进行了系统级的模拟评估,在被测chiplet架构通用处理器上运行操作系统及PARSEC 3.0基准测试程序,验证了SEEChiplet的功能,证明SEEChiplet可以对chiplet设计空间进行探索和评估。 张聪武 刘澳 张科 常轶松 常轶松关键词:设计空间探索 缓存系统 一种低功耗的FPGA部分可重构方法和装置 本发明提出一种低功耗的FPGA部分可重构方法和装置。本发明方案所述的系统装置通过结合FPGA静态区逻辑的裁剪及重构切换技术、存储器控制接口休眠与动态时钟管理单元的时钟频率实时调整机制,有效地降低了FPGA静态逻辑区的无效... 张科 齐乐 陈明宇一种FPGA集群管理与部署比特流的方法 本发明提供一种FPGA集群,包括FPGA集群管理节点、FPGA节点以及FPGA容器编排系统,所述FPGA节点包括FPGA芯片、内存、NVMe固态硬盘以及网卡,其中FPGA容器编排系统包括运行FPGA集群管理节点上的容器编... 张科 王泽霖 齐乐 赵然 常轶松 王嵩岳文献传递 一种面向SSI器件的FPGA持续集成开发方法与系统 本发明提供一种FPGA开发方法,所述方法包括步骤:步骤100:接收输入的HDL源文件和用户约束文件,进行OOC综合,生成逻辑网表,并封装为DCP文件;步骤200:接收步骤100生成的DCP文件,调用跨SLR接口电路自动化... 张科 齐乐 王泽霖 赵然