史莉雯 作品数:8 被引量:14 H指数:1 供职机构: 西北工业大学计算机学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 西安应用材料创新基金 更多>> 相关领域: 自动化与计算机技术 更多>>
可重构指令集计算机综述 2008年 简要介绍了可重构指令集计算机的体系结构、特征、以及发展状况,并在指令重构的基础上对目前可重构指令集计算机面临的问题作了一些讨论。 史莉雯 樊晓桠关键词:可重构 软硬件划分 双核处理器多级Cache的研究 本论文的研究内容是基于“十五”预研课题,目的是研究RISC微处理器的体系结构和方法,设计兼容于PowerPC指令集的32位嵌入式微处理器。
在课题研究中,本文作者主要负责高性能嵌入式微处理器... 史莉雯关键词:互联 文献传递 程序行为分析指导TLB低功耗设计 被引量:1 2011年 TLB(Translation Look-Aside Buffer,变换旁视缓冲器)是存储管理单元中完成访存地址转换的核心。但研究发现TLB工作时可以消耗微处理器芯片约17%的功耗。因此,TLB低功耗设计已经引起研究者的重视。通过对经典基准测试集程序访存行为的详细分析和仿真可知,在页面非连续访问时,页面间隔统计参数能够很好地指导TLB的低功耗设计。从这一角度出发,提出了低功耗的TLB设计方法。实验结果显示,改进后的TLB片上功耗明显降低。 史莉雯 樊晓桠 陈杰 黄小平 郑乔石关键词:低功耗 “龙腾R2”微处理器数据cache的设计与实现 2009年 集成电路制造工艺的迅猛发展为设计高性能微处理器系统打下基础,自主研发高性能微处理器在我国具有很重要的意义。在微处理器的体系结构设计中,"存储墙"问题是很多设计者将面对的难题。以前的研究证明了片上cache是解决处理器与主存储器之间的速度差异的有效措施之一,是片内存储系统中最关键的部分。因而,设计与系统相匹配的cache对于处理器整体性能的提升有很大的帮助。针对航空应用领域,西北工业大学航空微电子中心自主研发设计了32位嵌入式RISC微处理器"龙腾R2",考虑到其应用特性,提出了一种支持多机系统的数据cache的设计方案;讨论了其RAM组织结构、高速缓存一致性、监听协议等。介绍了具体设计实现,包括控制通路和数据通路的设计;并且提出了优化的设计方法,保证了数据cache的低功耗。目前芯片已经成功流片,采用CMOS0.18μm工艺实现,芯片面积为4.8×5.2mm2,主频达到233MHz。 张鹏 樊晓桠 陈杰 史莉雯关键词:数据CACHE 一致性 监听 片上多核处理器末级共享Cache可重用数据预测机制 被引量:1 2012年 为了减少片上多核处理器(Clip multi-processor,CMP)末级共享Cache中的干扰,根据应用程序的存储访问频率特性,提出了一种基于替换算法的可重用数据预测机制。当末级共享Cache的数据将被替换时,先检测此数据的历史访问信息,根据历史访问信息过滤出会被重复使用的数据,并将其保存在片上专用存储器中。仿真结果表明:本文的可重用数据预测机制将IPC(Instruction per clock)平均提高了2.9%,平均减少了应用程序中22.69%的有害替换,有效地减少了Cache抖动。 韩立敏 高德远 樊晓桠 史莉雯 安建峰关键词:计算机系统结构 多核处理器 单片多处理器的研究 被引量:10 2007年 单片多处理器结构支持较高线程级的并行,能显著提高性能。介绍了单片多处理器的结构,对一些结构模型和实际的商用处理器进行举例,并对关键技术进行了研究分析。 史莉雯 樊晓桠 张盛兵关键词:线程级并行 32位双发射双流水线结构RISC微处理器设计 被引量:1 2011年 "龙腾R2"是西北工业大学自主研制的32位嵌入式RISC微处理器,与IBM公司的Power-PC750处理器pin-to-pin兼容。综合考虑面积、功耗、实时响应以及性能要求等因素,文章提出了一种应用于嵌入式处理器微架构设计的双发射双流水线结构。该结构的核心思想是在指令流水线前端处理阶段动态检测相邻指令的先后依赖关系,预先完成双发射判断。文中首先介绍了"龙腾R2"的微体系架构,然后重点讨论了基于双发射双流水结构的指令调度策略、相邻指令耦合关系、双发射下的相关处理以及精确异常考虑等。采用M ibench基准程序完成了性能评测,综合分析结果显示,该结构对算术计算类程序流加速明显,并且电路结构清晰,易于设计验证,同时发现优化存储系统结构是提升该处理器性能的关键。文章最后对"龙腾R2"的可测试性设计以及硅物理设计等关键技术进行了论述。"龙腾R2"已流片成功,整个处理器采用SMIC 180nm CMOS工艺,芯片面积5.9 mm×6.7 mm,核心频率266 MHz,CBGA360封装。 黄小平 樊晓桠 张盛兵 史莉雯关键词:可测试性设计 超标量处理器中引入SMT技术的性能分析研究 被引量:1 2009年 同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"为基础,引入SMT技术,在基本不改变内部结构大小、不增加执行功能部件、仅做一些必要修改的前提条件下进行研究。通过仿真不同的线程数和各种线程组合,进行性能分析。尽管存在制约性能提升的一些因素,引入SMT技术后依然获得了最高约50%的性能增加。 史莉雯 樊晓桠 黄小平关键词:超标量处理器 同时多线程