国家高技术研究发展计划(2012AA01A306) 作品数:12 被引量:45 H指数:4 相关作者: 徐金秀 孟祥旭 王寅峰 陈衡 伍卫国 更多>> 相关机构: 西安交通大学 江南计算技术研究所 山东大学 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 航空宇航科学技术 电子电信 更多>>
无线传感器网络基于参数可调增强型覆盖控制算法 被引量:18 2015年 覆盖问题是无线传感器网络领域的一个基本问题,也是无线传感器网络特性当中的一个重点问题.如何通过某种算法达到以最少传感器节点对监测区域的有效覆盖已成为目前研究的一项重要课题.因此,提出一种增强型覆盖控制算法(Enhanced Coverage Control Algorithm,ECCA).该算法通过概率理论知识可以有效地求解出对监测区域进行有效覆盖下的最少节点,给出了传感器节点概率的期望值计算方法以及目标节点首次被传感器节点覆盖和多次覆盖后的期望值求解过程,验证随机变量相互之间不独立时的比例函数关系.仿真结果表明,ECCA算法可以使用较少的传感器节点数量完成对监测区域的有效覆盖,提高了对监测区域的覆盖质量. 孙泽宇 伍卫国 王换招 陈衡 邢萧飞关键词:无线传感器网络 基于MWM的闪存数据库缓冲区置换算法 2015年 针对现有闪存数据库缓冲区置换算法无法充分发挥闪存存储器性能的现状,提出了一种基于最小权重矩阵(MWM)的高效缓冲区置换算法.该算法基于缓冲区代价置换算法思想,使用MWM来组织管理缓冲区的数据块,将数据访问频度映射为权重参数,用来参与缓冲区中数据块的置换.在闪存感知平台Flash-DBSim上针对几种典型测试类型数据集进行对比实验,结果表明:本文算法充分利用数据访问特征,特别适用于数据库中数据使用频率高的应用场景. 崔金华 伍卫国 王寅峰关键词:缓冲存储器 闪存数据库 基于AdaBoost.MH的Reyes渲染架构时间预估算法 被引量:2 2014年 在大规模真实感渲染系统中,需要对渲染任务进行分解和调度,将其优化后分配给不同的可用计算资源,实现快速集群渲染。为了实现渲染任务的有效分解和调度,提高并行效率,高精度的时间预估算法是不可欠缺的。通过深入研究使用RenderMan规范的渲染器常用的Reyes渲染架构中对渲染时间产生影响的各种因素,分析提取出影响渲染时间的7大要素特征,提出了基于AdaBoost.MH的渲染时间预估算法。通过在基于Reyes渲染架构的渲染引擎中的实验与测试表明,训练集和测试集的准确率分别达到79%和78%,为渲染任务的并行调度奠定了基础,同时也为渲染费用预估提供了依据。 孟庆利 吕琳 靳颖 孟祥旭 孟雷关键词:ADABOOST 集群渲染 采用Intel集成众核架构的并行光线追踪加速方法 被引量:2 2015年 针对真实感渲染光线追踪流程中光线和场景求交计算量大、渲染速度慢的问题,提出一种基于Intel集成众核架构的并行光线追踪加速方法.在场景预处理阶段,首先构建四分支场景加速结构,以适应于MIC的硬件架构.在光线追踪阶段,首先通过CPU主核控制光线追踪整体流程,该主核采用多线程调度优化策略,调度MIC从核进行光线和场景树的求交操作,实现CPU和MIC的异步数据传输,充分利用主从核的计算能力;在MIC从核的光线和场景树求交过程中提出一种并行求交算法,充分利用MIC宽SIMD处理单元,实现光线和场景树4个结点并行求交的向量化操作,以加速求交过程.实验结果表明,与CPU原生模式相比,文中方法在光线求交阶段可达到2~4倍的加速效果,整体光线追踪流程渲染速度亦得到显著提升. 宋元杰 王璐 孟祥旭关键词:光线追踪 协处理 非结构网格限制器研究 被引量:1 2015年 研究了6种限制器形式及其参数计算方法,其中新的自适应VenkatakrishnanM限制器能够根据当地流场特征自动调节参数从而实现不同区域不同特性.数值试验表明:非结构网格限制器对邻居集合选择方法较敏感,其中共面法比共点法精度高约15%;高马赫数时压缩型限制器比耗散型限制器计算精度高约10%~40%;参变量算法中,方向梯度法得到的流场比增量法平滑;自适应VenkatakrishnanM限制器能够模拟复杂超声速流动. 李芳 孙唯哲 刘鑫 徐金秀关键词:限制器 非结构网格 自适应 超声速 采用资源划分的云环境下Hadoop资源许可调度方法 被引量:1 2015年 针对云计算环境中Hadoop平台由于节点计算能力差异、多样混合负载共存等原因而出现的性能不佳的问题,提出一种采用资源划分的资源许可方法。该方法在云计算环境下通过减少资源浪费或负载过重等情况的出现来提高系统性能。该方法采集资源信息并推测任务资源需求,根据可用计算资源和任务需求动态划分、调度资源;使用与资源无耦合的资源许可启动任务并控制任务数量调节资源利用率以适应云环境。使用该方法对比公平调度器在国家高性能计算中心(西安)进行测试发现:单作业在资源竞争环境中优于公平调度器的静态结果;混合负载在3种测试环境中完成时间分别平均减少了27.5%、37.1%和50.98%,性能显著提升。实验结果表明,该方法可以适应负载资源需求和可用计算资源的变化,灵活划分计算资源,解决Hadoop在云环境中的性能不佳问题。 周墨颂 朱正东 董小社 陈衡 王寅峰关键词:云计算 HADOOP 作业调度 一种短作业环境下的延迟调度算法 被引量:2 2015年 针对短作业场景下YARN平台中延迟调度算法基于静态时间等待阈值,不能进行合理等待的问题,提出了一种云计算环境中基于本地性资源预测的延迟调度算法(locality resource forecast delay scheduling,LRFD)。该算法综合考虑短作业和资源可用性动态变化的特点进行任务调度,根据节点上任务的完成进度和作业未处理数据在集群中的分布状况预估作业的本地性资源信息,从而判断是否需要进行等待以提高系统性能,实现了对本地性资源的合理等待。实验结果表明:在短作业场景下,LRFD算法的性能和稳定性均优于已有的延迟算法,作业性能平均提升约10%,最大加速比可达3倍以上。 刘强 董小社 朱正东 王寅峰关键词:云计算 结合深度图像和强度图像的人脸浅浮雕生成算法 被引量:8 2015年 针对单纯基于深度图像压缩方法生成的三维浮雕模型容易存在大量噪声,并且易丢失细节的问题,为了生成特征表达准确且具有艺术美感的人脸浅浮雕,提出一种基于三维深度图像和与之对应的二维强度图像的混合人脸浅浮雕的生成算法.首先对三维深度图像的高度场进行压缩生成浮雕基网格;然后提取二维强度图像的灰度信息、梯度信息和显著度信息,并基于显著度信息对基网格的高度场相应地叠加灰度和梯度信息,以保持脸部五官的细节;最后根据显著度信息使用Laplace算子对网格进行光顺处理,使脸部光滑.实验结果表明,与单纯使用基于深度图像压缩方法相比,文中算法生成的浅浮雕模型可以更好地保持五官的细节特征;与基于图像的浮雕生成方法相比,该算法避免了复杂交互操作,可以更好地保持人脸的整体轮廓和形状. 陆巧 王璐 孟祥旭 王文佳关键词:深度图像 面向国产异构众核处理器SW26010的BFS优化方法 2020年 近年来,人们越来越关注计算机对数据密集型课题的处理能力。宽度优先搜索(Breadth First Search,BFS)是一种典型的数据密集型课题,被广泛应用于多种图算法。Graph 500 Benchmark以BFS搜索为核心算法,已经成为评价计算机处理大数据能力的基准。神威太湖之光超级计算机从2016年6月至2017年11月连续4次荣登Top 500榜单榜首,其处理器SW26010是首款由我国自主研制的异构众核处理器。文中研究了如何利用SW26010的体系结构特点加速BFS算法的问题,在SW26010上实现了基于单个核组的方向优化的融合BFS算法,使用字节图(bytemap)释放内层循环依赖性,利用异步DMA隐藏计算与便签存储器的访问开销,利用异构架构协同运算并对图做预处理。最终,以Graph 500作为基准测试程序处理scale为22的图,SW26010处理器单核组BFS的性能达到457.54MTEPS。 袁欣辉 林蓉芬 魏迪 尹万旺 徐金秀关键词:宽度优先搜索 基于GPU异构平台的实时CT图像重建系统的研究 被引量:5 2019年 针对采用单CPUCT图像重建时间长,采用CPU集群重建成本及能耗高的问题,提出了CPU多线程+GPU的异构重建模型。采用CPU多线程流水线模式,将整个任务分解为若干个处理阶段,相邻的两个阶段之间以循环缓存连接,上一阶段完成一次计算任务后将数据放到循环缓存里,然后继续下一次的计算任务,下一阶段探测到循环缓存里有数据后从缓存里取出数据开始计算。各个任务是并行处理任务的,针对某一耗时瓶颈模块再采用GPU并行加速,充分发挥CPU和GPU的计算资源。CPU多线程+GPU模型相对于CPU多线程模型加速了16.45倍,相对于串行CT图像重建加速了20.5倍以上。将CPU多线程+GPU模型重建的图像与CPU串行程序重建的CT图像相比较,数据结果在误差范围内,满足实验设计要求。提出的图像重建模型采用成本较低的GPU显卡就实现了性能大幅提升,大大降低了CT图像重建系统的成本及功耗,而成本及功耗的降低会引起CT医疗诊断费用的降低,最终惠及广大病患。 夏松竹 杨静 方宝辉 徐金秀关键词:GPU CT图像重建 流水线