您的位置: 专家智库 > >

马可

作品数:4 被引量:34H指数:2
供职机构:中国科学技术大学计算机科学与技术学院更多>>
发文基金:北京市自然科学基金国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文

领域

  • 4篇自动化与计算...

主题

  • 3篇处理器
  • 2篇性能分析
  • 2篇上网
  • 2篇片上网络
  • 2篇网络
  • 1篇多核
  • 1篇多核处理
  • 1篇多核处理器
  • 1篇用户
  • 1篇用户级
  • 1篇体系结构
  • 1篇片式
  • 1篇拓扑
  • 1篇拓扑结构
  • 1篇微处理器
  • 1篇微体系结构
  • 1篇龙芯
  • 1篇龙芯2号处理...
  • 1篇路由
  • 1篇路由算法

机构

  • 4篇中国科学技术...
  • 3篇中国科学院

作者

  • 4篇马可
  • 3篇章隆兵
  • 1篇张戈
  • 1篇胡伟武
  • 1篇黄琨
  • 1篇曾洪博
  • 1篇朱晓静

传媒

  • 2篇软件学报
  • 1篇电子学报

年份

  • 2篇2008
  • 2篇2007
4 条 记 录,以下是 1-4
排序方式:
Xmesh:一个mesh-like片上网络拓扑结构被引量:25
2007年
针对片上网络(network on chip,简称NoC)的节点数量少、距离近、物理实现复杂度受到限制的特点,提出了一种新的Xmesh拓扑结构,并为该结构提出了XM路由算法.该结构在经典的mesh结构的基础上添加了两个对角线型的回边,缩短了节点间的距离,而且路由计算的复杂性不高,实现的复杂度基本没有增加.将Xmesh与经典的Mesh和Torus结构进行了理论分析比较,同时,在Popnet模拟器上基于均衡负载和热点负载两种负载模式进行性能比较.模拟结果表明,Xmesh平均延时不到Mesh结构的70%.对于均衡负载,当网络规模较小时,Xmesh的延时比Torus的更小;对于热点负载,当热点距离网络中心或者对角线比较近时,Xmesh的延时比Torus的小10%~30%.反之,其延时比Torus的大10%~30%.总的来说,Xmesh的性能与Torus比较接近,但其物理实现更为简单,Xmesh比Mesh结构的性能更好.
朱晓静胡伟武马可章隆兵
关键词:拓扑路由算法片上网络
一种分片式多核处理器的用户级模拟器被引量:8
2008年
随着片上晶体管资源的增多和互连线延迟的加大,分片式多核微处理器已成为多核处理器设计的新方向.为了对这种新型处理器进行体系结构的深入研究和设计空间的探索,设计并实现了针对分片式多核处理器的用户级多核性能模拟器.该多核模拟器在龙芯2号单处理器核的基础上,完整地模拟了基于目录的Cache一致性协议和存储转发式片上互联网络的结构模型,详细地刻画了由于系统乱序处理各种请求应答和请求之间的冲突而造成的时序特性,可以通过运行各种串行或并行的工作负载对多核处理器的各种重要性能指标加以评估,为多核处理器的结构设计提供了快速、灵活、高效的研究平台.
黄琨马可曾洪博张戈章隆兵
关键词:模拟器片上网络
一种基于微基准程序和理想上限的处理器性能分析方法
2008年
随着现代高性能通用处理器结构的不断发展,处理器的性能分析已经变得越来越困难.基于大工作负载和单纯依靠模拟器的性能分析方法复杂度高,且难以直观地反映微体系结构特征.本文针对超标量处理器的特点,提出一种新的处理器性能分析方法,具体包括:设计一个微基准程序集Godson-Microbench,并提出相应的理想性能上限计算公式.这种方法扩充了过去基于约束的性能分析方法,可以更加完整地评估流水线性能并有效地发现性能瓶颈.本文使用这种方法分析比较了龙芯2号处理器和Alpha21264处理器,并依此改进了龙芯2号的结构,使得微基准程序的平均性能提高了13.8%,SPEC程序集的IPC提高了28.8%.本文提出的性能分析方法在龙芯2号的结构优化工作中发挥了重要作用.
马可章隆兵
关键词:性能分析龙芯2号处理器
微处理器性能分析模型的建立和研究
随着集成电路工艺的不断发展和应用的日益多样化,微处理器结构设计工作的复杂度也越来越高。如何利用有限的设计时间和资源来高效地分析处理器性能是每个设计者都要面临的问题。现有的基于结构级模拟器进行性能分析的方法所需时间过长且无...
马可
关键词:超标量微处理器分析模型性能分析微体系结构
共1页<1>
聚类工具0