您的位置: 专家智库 > >

国家高技术研究发展计划(2009AA011705)

作品数:17 被引量:17H指数:3
相关作者:陈乃金谢憬毛志刚江建慧周洲更多>>
相关机构:上海交通大学同济大学安徽工程大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金安徽省高校省级自然科学研究项目更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 17篇期刊文章
  • 1篇会议论文

领域

  • 12篇自动化与计算...
  • 6篇电子电信

主题

  • 7篇可重构
  • 5篇时域
  • 5篇资源约束
  • 4篇映射
  • 4篇时域划分
  • 4篇可重构计算
  • 3篇处理器
  • 2篇多核
  • 2篇硬件
  • 2篇映射算法
  • 2篇数据流
  • 2篇数据流图
  • 2篇体系结构
  • 2篇粒度
  • 2篇流图
  • 2篇VLSI架构
  • 2篇粗粒度
  • 2篇粗粒度可重构
  • 2篇ARM
  • 1篇地址映射

机构

  • 9篇上海交通大学
  • 8篇同济大学
  • 6篇安徽工程大学
  • 2篇天津大学

作者

  • 6篇谢憬
  • 6篇陈乃金
  • 6篇毛志刚
  • 6篇江建慧
  • 3篇周洲
  • 3篇王琴
  • 2篇陈昕
  • 2篇徐莹
  • 2篇何卫锋
  • 1篇蒋剑飞
  • 1篇孔亮亮
  • 1篇杨栅
  • 1篇马汝亮
  • 1篇温琳卉
  • 1篇王国兴
  • 1篇邢慧敏
  • 1篇李涌伟
  • 1篇蒋圆圆
  • 1篇肖杰
  • 1篇王浩

传媒

  • 7篇微电子学与计...
  • 2篇电子学报
  • 2篇计算机工程
  • 2篇计算机辅助设...
  • 1篇计算机应用
  • 1篇小型微型计算...
  • 1篇Wuhan ...
  • 1篇电脑知识与技...

年份

  • 1篇2016
  • 2篇2015
  • 5篇2013
  • 5篇2012
  • 4篇2011
  • 1篇2010
17 条 记 录,以下是 1-10
排序方式:
考虑通信成本和硬件碎片利用的簇划分算法被引量:1
2015年
针对面积约束下的可重构硬件任务划分问题,提出一种通信成本和硬件碎片利用的簇划分算法.根据簇划分算法的思想,在某一硬件面积的约束下,从待调度的就绪队列中节点依次划入到当前块,在划分过程中,若遇到不满足要求的节点就跳过,并继续搜索可划入到当前块且没有增加块间边数的节点.每划入一个节点就更新其后继的入度,如果入度为0且满足要求,将其直接划入;否则动态考查其前驱,如果前驱所需的面积满足规定的阈值,则将该节点后继和前驱一并划入到当前块.通过充分考虑节点权值、节点间的依赖度、层次小的节点优先划入等因素构造响应比函数,以动态地调整就绪列表节点的调度次序.实验结果表明,与簇划分算法和簇层次敏感划分算法相比,文中算法在划分块间非原始I/O次数、划分块数等方面均获得了较好的改进;在减少块间通信成本方面,该算法具有合理性和可行性.
陈乃金江建慧
关键词:可重构计算时域划分资源约束
一种基于ESVW技术的新型载入存储队列设计
2013年
在超标量处理器设计中,SVW技术通过降低重新执行的载入指令数目提高系统性能.本文提出一种基于ESVW技术的新型载入存储队列设计方案,使得SVW结构中的SSBF不仅记录SSN值,同时记录存储地址和数值,重新执行的载入指令就可以从中获取数据而不必访问缓存,进一步降低指令的重新执行率.实验结果显示,最优情况下,超过99%的载入指令免于二次访问缓存,系统性能提高约2%.
马汝亮谢憬毛志刚
关键词:超标量处理器
数字信号处理器分布式寄存器的写回设计
2013年
针对分布式寄存器文件应用于高性能超长指令字(VLIW)数字信号处理器而造成的分支流水线与写回控制信号的同步问题,提出了一种面向分布式本地寄存器文件的写回策略.其中包括指令执行周期的产生,写回信号缓存以及写回控制单元.采用了面积功耗性能评估方法,结果证明了该策略能充分发挥分布式寄存器文件在功耗方面的优势,相对于运用集中式寄存器文件可以减少50%的功耗,同时对于传统流水线写回控制方法可以节省60%的面积开销.
邵铮谢憬王琴毛志刚
关键词:超长指令字流水线
二维5/3小波变换在并行计算单元中的设计实现被引量:1
2013年
本文提出了一种针对整数二维5/3小波提升算法的并行计算设计方案,其整体结构具有行变换与列变换之间并行计算、数据分组输入、不同行变换(列变换)之间并行计算的特点.文中重点介绍了该小波提升算法的取整处理模式、算法改进和硬件设计实现等方面.本文结构平均每周期输出2个变换结果,完成对N×N大小图像的处理需花费大约N2/2个时钟周期,同时在FPGA中实现最高同步时钟频率394.
温琳卉谢憬王国兴
关键词:硬件设计FPGA
一种考虑执行延迟最小化和资源约束的改进层划分算法被引量:7
2012年
本文提出了一种改进的层划分算法.该算法充分考虑了划分块的最小执行延迟和尽可能充分利用可重构资源,能够跟踪层划分算法节点分配过程并进行调整,消除了经典层划分算法不能动态更新就绪节点列表选取节点进行划分的缺陷.实验结果表明,与层划分算法相比,所提出的改进层划分算法在模块数、执行延迟和跨模块间的I/O边数等三个方面均获得了改进.与现有的簇划分、增强静态列表、多目标时域划分、簇层次敏感等四种划分算法相比,新算法能获得最少的执行延迟,并且随着可重构处理单元面积的增大,模块数的均值也是最小的.
陈乃金江建慧陈昕周洲徐莹
关键词:可重构计算时域划分资源约束
一种VLIW循环指令的预取和优化策略
2013年
本文提出了一种VLIW处理器的预取和针对循环指令的优化策略.文中重点介绍了预取普通指令和处理循环指令的方法,以及普通预取和循环预取这两种预取模式间的切换方式.基于该设计和优化方案,可以有效减小取指操作的功耗.实验证明,在针对不同的应用上,减少的功耗从40%到90%不等,优化了该VLIW多运算簇DSP处理器的性能.
琚魁谢憬毛志刚
关键词:DSP处理器VLIWSIMD指令预取
基于深度优先贪婪搜索的可重构硬件任务划分算法被引量:3
2012年
针对可重构计算硬件任务划分通信成本较小化的问题,提出了一种基于深度优先贪婪搜索划分(DFGSP)算法。首先,从待调度的就绪队列中取出队首任务,在某一硬件面积约束下,按深度优先搜索(DFS)方式扫描一个计算密集型任务转换来的有向无环图(DAG),逐个划入满足要求的节点;然后,一遇到不满足面积要求的任务节点时,就计算当前划分模块间输出边数(可量化为通信成本);最后,跳过当前不满足要求的任务节点,继续搜索该点之后处于就绪状态的节点,当搜索到满足要求的点时,按加入该点后不增加当前划分块间输出边数和尽可能填满可重构运算阵列的原则进行。实验结果表明,与现有的簇划分(CBP)、簇层次敏感两种划分算法相比,提出的算法获得了最小划分模块数和平均跨模块间I/O边数最小的均值,通过实际验证,算法显著地改善了硬件任务的划分效果,而且运行开销没有明显增加。
陈乃金
关键词:可重构计算时域划分资源约束
用基于模拟的非线性方法估计ARM程序执行周期
文中采用基于模拟的非线性方法,设计和实现了一个面向ARM程序的执行周期估计器.它利用人工神经网络在描述动态指令数与执行时间在复杂结构处理器上非线性关系的优势,用基准程序集在指令集模拟器上获得的功能剖面和执行时间训练网络,...
孔亮亮江建慧肖杰蒋圆圆
关键词:ARM体系结构人工神经网络
文献传递
一种多核系统中的二维块数据存储机制被引量:1
2011年
针对多核系统中处理二维数据时的数据对齐、地址映射等问题,提出一种多核系统中的二维块数据存储机制。介绍二维块数据在计算前后的数据分配、寻址及传输机制及一般应用方法,并对典型应用进行仿真验证。结果证明,该存储机制能减轻处理单元和存储单元间的不平衡性,改善一维和二维之间的不匹配现象。
邢慧敏谢憬毛志刚
关键词:寻址数据对齐地址映射多核
一种基于GALS的四核内部互连及任务调度研究
2012年
本文给出一种基于全局异步局部同步(Global Asynchronous Local Synchronous)的四核数字信号处理器(Digital Signal Processor)内部互联设计方案.全局异步局部同步的设计模式可以使四个DSP核心根据任务需要工作在不同的频率域,从而降低芯片的总功耗且避免了全局时钟树设计.多核之间采用DMA通道进行数据交换,在占用较小CPU负担的同时,获得较大数据带宽.本文给出一种任务队列的任务调度机制,用于完成多核之间任务的自助申请调度以及数据流的控制.以MP3的解码程序为例,对任务在多核上的分割方法和调度策略进行详细的阐述.
杨栅蒋剑飞王琴
关键词:多核处理器任务队列任务调度机制
共2页<12>
聚类工具0