您的位置: 专家智库 > >

国家教育部博士点基金(20116102120049)

作品数:5 被引量:4H指数:1
相关作者:张萌孙立超樊晓桠张盛兵赵磊更多>>
相关机构:西北工业大学更多>>
发文基金:国家教育部博士点基金西北工业大学基础研究基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 3篇处理器
  • 2篇体系结构
  • 1篇多处理系统
  • 1篇多发
  • 1篇信号
  • 1篇信号处理
  • 1篇信号处理器
  • 1篇阵列
  • 1篇人脸
  • 1篇人脸检测
  • 1篇人脸检测算法
  • 1篇数字信号
  • 1篇数字信号处理
  • 1篇数字信号处理...
  • 1篇取器
  • 1篇微处理器
  • 1篇微处理器芯片
  • 1篇现场可编程
  • 1篇现场可编程门...
  • 1篇芯片

机构

  • 5篇西北工业大学

作者

  • 4篇张萌
  • 2篇赵磊
  • 2篇张盛兵
  • 2篇樊晓桠
  • 2篇孙立超
  • 1篇陈超
  • 1篇田杭沛
  • 1篇白龙飞
  • 1篇程训焘
  • 1篇刘芳

传媒

  • 2篇西北工业大学...
  • 2篇计算机与现代...
  • 1篇计算机工程与...

年份

  • 4篇2013
  • 1篇2012
5 条 记 录,以下是 1-5
排序方式:
基于CUDA的快速人脸检测算法被引量:1
2013年
针对传统的CPU人脸检测程序难以满足高清图像实时检测要求的问题,本文提出一种在CUDA平台下基于Viola-Jones级联分类器的快速人脸检测算法,其中积分图计算、扫描窗口检测和分类器放大修正部分均进行了并行加速。扫描窗口检测采用的窗口重映射技术可有效解决非规则树结构应用的负载不均衡问题。实验结果表明,对于1080p图像,CUDA程序与CPU和OpenCV程序相比可分别实现17.04、3.22倍的加速比,同时具有相近的检测精度。
孙立超张盛兵程训焘张萌
关键词:人脸检测级联分类器积分图计算统一设备架构HAAR-LIKE特征
面向混杂流计算的适应性存储器体系结构被引量:1
2012年
可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结构能够同时适应混杂流计算中流数据以及标量数据的存储需求;采用了适应性动态存储资源分配策略和适应性动态地址映射策略解决地址映射冲突问题;通过全硬件支持非规则流、条件流的存储与访问,混合数据替换策略能够充分挖掘数据的生产者-消费者局部性及时间、空间局部性。验证评估实验表明,相对Cache以及SPM(Scratchpad Memory),DAMS Cache算法的适应性较好,面向混杂流计算的性能较优。
张萌赵磊樊晓桠田杭沛
龙腾Stream流处理器验证被引量:1
2013年
芯片设计复杂度的提高迫切地需要先进的方法学以应对巨大的验证工作量。通过开发基于System Verilog的覆盖率驱动的自动化验证平台,对龙腾Stream流处理器的指令集进行了功能验证。实验结果表明,该验证平台提高了验证效率和功能覆盖率,具有良好的重用性和可移植性。搭建FPGA原型验证系统对流处理器的功能和系统性能进行了评测,并提出了优化流处理器加速性能的方法。
白龙飞樊晓桠张萌孙立超
关键词:流处理器VERILOG
多发射多流水线结构数字信号处理器设计被引量:1
2013年
zw100处理器是西北工业大学和某研究所共同研制的采用MCU-DSP相融合架构的32位数字信号处理器。提出一种多发射多流水线结构来进行数字信号处理器的微体系结构设计,使该处理器同时具备了RISC load/store体系结构、DSP的计算能力和MCU的实时控制能力等特点。从zw100处理器指令集设计出发,首先介绍了该处理器架构和主要单元,然后重点讨论了基于多发射多流水线结构的指令调度策略、相邻指令耦合关系与发射机制、多发射条件下流水线相关的处理等。最后,对设计进行了仿真验证,并给出综合结果。目前,该处理器已采用TSMC 65nm CMOS工艺流片成功,频率达到500 MHz,达到2G MAC/s的运算能力,性能指标满足设计要求。
陈超张盛兵
关键词:数字信号处理器
基于SESC仿真器的存储预取器设计
2013年
仿真器是在宿主机上运行并能模拟目标体系结构机器行为的一种软件系统,它可以解释并执行目标体系结构机器上可执行的程序,同时可提供运行时的指令和事件相关记录,以及目标体系结构机器的性能统计参数。系统级体系结构仿真器是可以作为一个虚拟目标机器运行的软件系统,它可以实现对单(多)处理器、内存系统、Cache和外部设备等子系统的功能模拟。本文根据多核处理器结构特点,研究体系结构仿真器与测试程序的设计方法。利用体系结构仿真器,分析不同结构的多核处理器片外存储访问需求,讨论片外存储访问带宽对计算性能的影响问题。总结出多核系统片外存储器访问的机制与需求,以及片外访存与程序特征的关系。
赵磊张萌刘芳
共1页<1>
聚类工具0