公共文化服务平台

2024年7月3日星期三

|

欢迎来到南京江宁区图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

沈立: 作品数：96 被引量：184H指数：8; 供职机构：国防科学技术大学计算机学院更多>>; 发文基金：国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>; 相关领域：自动化与计算机技术文化科学政治法律更多>>

合作作者

王志英国防科学技术大学计算机学院
戴葵国防科学技术大学计算机学院
张春元国防科学技术大学计算机学院
陆洪毅国防科学技术大学计算机学院
陈微国防科学技术大学计算机学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

60篇期刊文章
23篇专利
9篇会议论文
2篇学位论文

领域

60篇自动化与计算...
16篇文化科学
1篇政治法律

主题

21篇处理器
12篇体系结构
12篇计算机
10篇进制
10篇课程
10篇二进制
9篇微处理器
8篇教学
8篇二进制翻译
7篇动态二进制
7篇动态二进制翻...
6篇计算机体系
6篇编译器
5篇代码
5篇多核
5篇译码
5篇指令集
5篇流水线
5篇计算机体系结...
5篇GPU

机构

94篇国防科学技术...
2篇同济大学
1篇复旦大学
1篇国防科技大学
1篇飞腾信息技术...

作者

94篇沈立
69篇王志英
22篇戴葵
16篇陆洪毅
15篇张春元
12篇陈微
10篇马胜
10篇肖侬
9篇鲁建壮
8篇郑重
7篇甘新标
7篇徐帆
7篇陈顼颢
7篇赖明澈
5篇黄立波
5篇王蕾
5篇钱程东
5篇赖鑫
4篇岳虹
4篇吕雅帅

传媒

14篇计算机工程与...
11篇计算机教育
7篇计算机科学
5篇电子学报
4篇计算机研究与...
4篇计算机辅助设...
4篇计算机科学与...
1篇武汉理工大学...
1篇华中科技大学...
1篇计算机工程
1篇西安交通大学...
1篇小型微型计算...
1篇软件学报
1篇四川大学学报...
1篇实验室研究与...
1篇软件导刊
1篇教育教学论坛
1篇集成技术
1篇NCIS20...
1篇第八届计算机...

年份

1篇2024
4篇2023
2篇2022
3篇2021
3篇2020
3篇2019
2篇2018
2篇2017
2篇2016
3篇2015
5篇2014
5篇2013
6篇2012
11篇2011
9篇2010
4篇2009
4篇2008
3篇2007
3篇2006
3篇2005

共 96 条记录，以下是 1-10

全选清除导出

排序方式：

一种低成本128位高精度浮点SIMD乘加单元的设计与实现: 2012年; SIMD单元集成已经成为提高处理器性能的重要途径之一。虽然定点SIMD单元的硬件复用低成本设计技术已经较为成熟,但是,大部分浮点SIMD单元的硬件设计还停留在简单的硬件复制方法上。本文针对日益增长的128位高精度浮点操作的计算需求,提出了其相应的SIMD低成本硬件结构方案。综合实验结果表明,所提出的SIMD浮点乘加单元比传统128位高精度浮点乘加单元具有更加优化的性能与面积参数。; 黄立波王志英沈立马胜; 关键词：单指令多数据

一种高效的压缩Page Walk Cache结构: 2020年; 通用图形处理单元(GPGPU)已被广泛应用于现代高性能计算系统中。GPGPU的单指令多线程执行模型导致快表命中率较低,特别是对于那些不规则应用,需要借助PWC减少实际的页表访问次数。传统PWC中存在很多冗余信息,加之容量有限,实际效果并不理想。分析了传统PWC中的信息冗余情况,提出了一种新结构——压缩PWC。压缩PWC在保证查找开销不变的基础上,完全消除了冗余信息,压缩了空间,使PWC能够记录更多的页表访问历史,从而有效减少地址转换过程中访问页表的次数。测试结果表明,与相同容量的传统PWC相比,压缩PWC可以显著缩短虚实地址转换时间开销。; 贾朝阳张敦博王琼沈立; 关键词：通用图形处理器

指令扩展中相关子图的分析与处理: 2009年; 由于没有充分考虑候选子图间重叠、包含等相关关系,按照现有指令扩展方法选出的扩展指令可能无法带来预期的性能收益.详细讨论了子图相关关系和处理方法,并提出相应的指令扩展算法.在子图识别时,根据延迟约束合并相互包含的子图,根据重叠结点的位置合并重叠子图,缩小搜索空间;在子图压缩时,根据子图相关关系动态地调整候选子图的性能收益,减少相关子图引起的估算误差.此外,还根据剩余候选子图的性能收益对时间与精度进行折中.该算法已在传输触发结构ASIP的自动设计流程中实现,实际性能加速比与预期值的平均误差仅为0.17%,远低于原先的3.6%.; 沈立张晨曦吕雅帅王志英; 关键词：专用指令集处理器

Xen虚拟集群监控器的设计与实现被引量：2: 2010年; 迁移是实现高效虚拟集群的关键技术之一,是实现系统负载平衡,提高系统服务能力和可用度的基础。迁移策略选择的是否合理取决于对虚拟集群中物理节点及其上部署的虚拟机资源状态的实时获取,而目前大多数虚拟机监控工具只能对单个物理节点及其上的虚拟机进行监控,无法收集虚拟集群内其它物理节点和虚拟机的状态信息。为满足各种虚拟机迁移策略的需求,设计并实现了一个虚拟集群监控器系统Prospector,该系统能够对物理集群中多个Xen服务器节点及其上部署的虚拟机的多种实时状态进行动态收集和整合,并对外提供统一监控视图。通过NPB基准程序测试,该系统总体平均开销仅为2%,对虚拟集群的性能影响很小。; 刘杨肖侬沈立; 关键词：虚拟机迁移虚拟集群

SIMD数据置换操作的自动生成和优化: 2011年; SIMD指令能够高效开发数据级并行,因此当前绝大多数通用微处理器都支持这种机制。但是应用程序和算法的一些固有特性,如访存地址不对齐、非连续存储访问以及控制流等,使得编译器或程序员必须借助置换指令重新组合向量的各个元素,才能得到符合SIMD指令要求的操作数。这些冗余的置换指令已成为当前挖掘数据级并行的主要性能瓶颈。提出一种自动的数据置换指令生成和优化算法,以有效地减少置换指令带来的性能损失。该算法基于提出的一种新中间表示形式,其中包含有足够的操作数地址信息,因此可以将置换指令的生成转换为数据流图中冲突边的识别问题,而将置换指令的优化转化为用最少的置换指令来删除所有冲突边的问题。面向一组典型多媒体程序进行测试的结果表明,提出的算法可平均获得7%的性能加速。; 陈向沈立李家文; 关键词：数据置换

解同步电路中的功耗优化方法被引量：1: 2010年; 针对解同步方法设计的异步电路存在冗余功耗的问题,提出一种功耗优化的解同步异步电路设计方法.首先以迭代结构乘法器为例分析操作数及电路操作行为对异步流水线功耗的影响;然后将窄数据特性及操作行为特性引入到解同步设计方法中,其中窄数据特性用于优化数据通路,操作行为特性用于优化控制通路;最后采用该方法对异步传输触发体系结构(TTA)微处理器计算内核进行功耗优化设计.实验结果表明,结构优化后的异步TTA微处理器内核功耗明显减少,约为解同步异步内核功耗的60%.; 石伟沈立任洪广苏博王志英; 关键词：功耗优化

DSP处理器和通用处理器的比较被引量：3: 2005年; 随着嵌入式系统的广泛应用,其应用程序的功能变得越来越强大和复杂,从而要求嵌入式处理器系统既能有效支持运算密集型的应用,又能有效支持控制密集型的应用。数字信号处理器(DSPs)能够有效进行运算密集型的实时计算;另一方面,通用微处理器(GPPs)则对控制密集型的应用提供有效的支持。本文从DSP处理器和通用微处理器的功能出发,讨论了两者在指令集、体系结构及存储器结构等方面的异同,同时对两者的性能也进行了评测和比较。结果表明,DSP处理器和通用微处理器都很难同时高效支持运算密集型的应用和控制密集型的应用。将两者体系结构进行融合,研究开发融合型高性能微处理器,是解决该问题的有效途。; 岳虹沈立戴葵王志英; 关键词：DSP处理器通用处理器嵌入式系统指令集体系结构

面向众核GPU结构的椭圆曲线加密流化技术被引量：2: 2011年; 针对椭圆曲线加密系统的加密速度不能满足实时性要求的现状,分析了椭圆曲线加密机制(Elliptic Curve Cryptography,ECC)潜在的并行性,研究了GPU众核多线程及共享存储空间和只读Cache对ECC性能提升的影响,提出了以GPU强大计算资源和有效的存储带宽来流化加速ECC的方法。实验结果显示,在支持计算统一设备架构(Computing Unified Device Architecture,CUDA)的GPU上流化实现的ECC原型系统与优化的CPU实现相比可获得高达66×的加速度比。另外,针对ECC的流化并行及优化技术可作为一般方法推广至其它流体系结构。; 甘新标沈立王志英; 关键词：GPU 椭圆曲线加密计算统一设备架构

Xen虚拟集群监控器的设计与实现: 迁移是实现高效虚拟集群的关键技术之一，是实现系统负载平衡，提高系统服务能力和可用度的基础。迁移策略选择的是否合理取决于对虚拟集群中物理节点及其上部署的虚拟机资源状态的实时获取，而目前大多数虚拟机监控工具只能对单个物理节点...; 刘杨肖侬沈立; 关键词：虚拟机

通过两个取指令部件消除流水线控制相关延迟被引量：1: 2003年; 分支预测技术能够在一定程序上消除指令间的控制相关延迟,提高微处理器的性能,是微处理器设计的一项关键技术。一般说来,静态分支预测效率低,动态分支预测硬件复杂度高。嵌入式微处理器具有功耗低、硬件复杂度低等特点,这决定了它必须采用特殊的分支处理技术。本文提出了一种面向嵌入式微处理器的分支处理技术,利用双端口指令Cache,加上预取指令,在编译器的共同配合下,消除由控制相关引起的延迟。模拟结果表明,该技术具有硬件复杂度低、实现简单、控制相关消除率高等优点。; 沈立侯方勇王蓉晖戴葵王志英; 关键词：流水线计算机体系结构

全选清除导出

共10页<1 2 3 4 5 6 7 8 9 10>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@南京江宁区图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张