许建卫 作品数:16 被引量:23 H指数:3 供职机构: 国家高性能计算机工程技术研究中心 更多>> 发文基金: 国家高技术研究发展计划 中国科学院知识创新工程 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于给定访问序列的NFS预取技术 2011年 网络文件系统(Network File System)由于其稳定、易用而得到了广泛的应用。为了提高NFS服务器端的I/O性能,提出一种在给定客户端访问序列的NFS服务器端伪随机序列预取(NPRP:NFS Pseudo Random Prefetch)机制。实验测试结果表明,NPRP机制对特定应用的NFS服务器的I/O带宽提升超过2倍。 骆志军 许建卫 郑规 刘新春 邵宗有 聂华关键词:NFS 一种新型计算机体系结构模拟器的研究与实现 被引量:4 2007年 模拟器是研究新型高性能计算机体系结构的一种快速、有效的手段。并行计算机体系结构模拟器SandFox是为了开展对网格化动态自组织体系结构(DSAG)研究而研制的新模拟器,在设计中采用模块化和层次化设计思想,通过四个层次的逐级模拟实现了对DSAG结构全系统模拟,并体现了DSAG的结构特点如资源按需分配,资源部件管理,资源部件可重构等,模拟器自身也可以通过交互式界面动态调整系统配置。应用测试及对测试数据的分析,表明了SandFox模拟器的正确性、可扩展性与动态性。 包云岗 许建卫 陈明宇 樊建平关键词:模拟器 高性能计算机 高带宽远程内存结构中的预取研究 被引量:2 2005年 高速电路和光互联技术的发展极大地提高了网络的速度与带宽。因而,突破高性能计算机 CPU与内存紧耦合的传统结构成为可能,CPU与内存的耦合不再受距离的限制,这必将引起体系结构的变革。文[1]提出 DSAG结构——CPU与内存在空间上分离,每个CPU节点上仅留少量内存,将海量内存放在远程统一管理作为内存服务器,CPU节点和内存服务器之间通过高速网络互连。这种新的体系结构带来了更好的共享性和可扩展性,但同时也对我们解决CPU和内存之间的不平衡性问题带来了挑战。为了降低DSAG这种远程内存结构增加的访存时延,我们考虑到CPU正常访存没有充分利用网络的高带宽,因此可以利用剩余的网络带宽来进行远程内存数据的预取。本论文在应用程序执行时记录本地(相对于远程内存)不命中的地址信息,以页对齐分析其中存在的页框流(Page Frame Stream)的统计特征,并提出可基于页框流的预取机制可降低访存延迟、提升系统性能的观点。最后我们采用模拟的方法验证了观点的可行性与正确性,进一步提出了三种预取策略,比较并分析影响预取效果的因素。 许建卫 陈明宇 包云岗关键词:内存结构 预取策略 高带宽 远程 高性能计算机 高速电路 一种基于页面级流缓存结构的流检测和预取算法 被引量:1 2009年 为了提高网络内存的访存性能,基于一种页面级流缓存和预取结构提出了可变步长的带状流检测算法VSS(variable stride stream)和基于时钟步长的流预取优化算法来优化网络访存性能.带状流检测算法解决了固定步长流检测下循环访问中虚拟页地址的跳跃问题,消除了断流,可以有效提高流检测的覆盖率.基于时钟步长的流预取优化动态调整预取长度,可以解决有些预取不能及时取回的问题,进一步提高预取性能.通过和顺序预取算法的比较可以看出,VSS算法可以实现高准确率、低通信开销的预取.通过模拟分析了这种流缓存和预取机制在网络访存系统中的应用,验证了以少量性能下降换取灵活的远程内存扩展方法的可行性. 刘立 陈明宇 包云岗 许建卫 樊建平计算机体系结构模拟器技术和发展 被引量:12 2009年 对计算机体系结构模拟器的技术和发展历程进行评述,从速度、精度和灵活性三个方面对领域需求和相关技术做了分类总结,分析了上述三个方面的难点并从模拟器实现和使用两个层面介绍了现有的解决方案;给出了模拟器目前面临的困境及下一步发展趋势;对体系结构模拟器的开发和使用给出几点建议。 许建卫 陈明宇 杨伟 潘晓雷 郑规 赵健博 孙凝晖关键词:体系结构 模拟器 高性能计算机的并行模拟技术研究 模拟器是计算机系统体系结构研究的常用工具,是研究新型计算机系统的重要途径。未来,高性能计算机将向超大规模并行方向发展,不但节点规模进一步增加,节点内部的并行性也会进一步增加。这种并行化趋势给传统的串行模拟器带来了巨大的挑... 许建卫关键词:高性能计算机 超并行(HPP)体系结构的若干关键技术研究 孙凝晖 章隆兵 李晓维 陈明宇 马捷 陈莉 孙毓忠 刘淘英 李华伟 胡瑜 韩银和 高翔 黄琨 张文力 谭光明 包云岗 许建卫 袁清波 刘雷 张兴亮 李恒杰 商磊 臧洪永 李亚琼 宋莹 杨亚军 李如豹 汪浩 本课题的主要目标是为超龙计划的基础研究构建一个系列的研究平台,开展先期部分基础研究,为后续的基础研究和系统设计和评估奠定基础。其中,涉及到建立平台的包括系统级模拟和仿真平台,多核CPU模拟器,操作系统原型,UPC并行编程...关键词:关键词:体系结构 多核 基于给定访问序列的NFS预取技术 网络文件系统(NetworkFileSystem)由于其稳定性、易用性得到了广泛的应用。为了提高NFS服务器端的I/O性能,本文提出了一种在给定客户端访问序列的NFS服务器端伪随机序列预取(NPRP:NFSPseudoR... 骆志军 许建卫 郑规 刘新春 邵宗有 聂华关键词:网络文件系统 高带宽远程内存服务器性能分析 随着高速电路和光互联技术的发展,网络的速度和带宽都将得到极大的提高.利用高速度,高带宽的网络,我们可以打破目前计算机体系结构中内存和CPU紧耦合的状况,将海量的内存放到远程,这样不但提供了内存共享,而且带来更好的可扩展性... 许建卫 陈明宇关键词:光互联 文献传递 一种时钟级处理器模拟器的快速开发方法 被引量:1 2010年 基于功能级处理器模拟器,采用时序制导的方法,提出了一种时钟级处理器模拟器的快速开发方法。该方法对指令的模拟引入流水线,依靠流水线的时序推动功能模块的运行,如ALU、Co-processor、MMU、TLB等。给出了RISC/MIPS流水线的设计方法,并进一步阐述了如何将流水线和处理器功能级模拟单元的耦合起来,构成时钟级模拟的整体框架。基于此框架,开发了ClkSim模拟器。经过SPEC CPU 2000的对比测试,ClkSim拥有较高的模拟性能和精度。 杨伟 陈明宇 许建卫关键词:功能级