博士科研启动基金(B2012-099)
- 作品数:8 被引量:42H指数:2
- 相关作者:张霄宏沈记全贾宗璞赵文涛雒芬更多>>
- 相关机构:河南理工大学中国科学院郑州财经学院更多>>
- 发文基金:博士科研启动基金国家自然科学基金河南省科技攻关计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 同构Hadoop环境作业执行时间计算方法被引量:1
- 2014年
- 执行时间是作业调度的重要参考因素之一。通过分析Hadoop MapReduce环境作业的执行特征,提出了以map任务和reduce任务执行时间为输入,估算作业执行时间的方法。该方法在一定假设条件下,借助作业预执行来获取map任务和reduce任务的执行时间。实验结果表明,该方法估算作业执行时间的误差率小于7%。
- 张霄宏海林鹏贾宗璞沈记全赵文涛
- 关键词:HADOOPMAPREDUCE调度
- 一种Device-to-Device移动社交网络中的热点文件预测方法被引量:1
- 2018年
- 随着信息技术的蓬勃发展,移动社交网络越来越受到人们的关注,尤其是对移动社交网络中的热点分析.以基于Device-to-Device技术构建的移动社交网络为研究对象,从网络规模、文件分享特征以及用户影响力等方面入手,提出一种预测该类社交网络中热点文件的方法.该方法从信息和用户的角度出发,通过量化文件重要性、文件敏感性、用户参与力和用户影响力四个指标,利用多元线性回归方法建立预测模型,并在真实数据上验证了方法的有效性.
- 张霄宏侯海杰任建吉
- 一种适用于Hadoop MapReduce环境的数据预取方法被引量:5
- 2014年
- 为解决由Reduce任务引起的远程数据访问延时和资源竞争导致的系统性能问题,提出了一种基于预调度的数据预取方法.该方法通过预取数据来隐藏由Reduce任务引起的远程数据访问延时,通过控制与Reduce任务相关的资源分配来减少由其引起的资源竞争.此方法已在Hadoop-0.20.2中实现.实验结果表明,与缺省的Hadoop MapReduce及Hadoop Online Prototype相比,该方法可将系统性能提高10%以上.
- 张霄宏雒芬贾宗璞沈记全
- 关键词:MAPREDUCE分布式计算调度
- 基于容量感知和负载特征的虚拟机选择算法被引量:1
- 2015年
- 虚拟机迁移是解决物理服务器过载的主要手段之一。作为虚拟机迁移领域的经典算法之一,基于最小迁移时间的虚拟机选择算法虽然具有较低的服务等级协议违例率,但是往往需要迁移多个虚拟机才能解决一次过载,效率较低。为解决这一问题,提出了一种基于容量感知和负载特征的虚拟机选择算法。该方法利用最少虚拟机策略和最小迁移时间策略选择虚拟机,以此降低解决服务器过载时迁移的虚拟机次数和耗费的时间。与基于最小迁移时间的算法相比,文中方法可以在保证服务质量的同时将迁移次数降低56.8%。
- 张冬生沈记全张霄宏
- 关键词:虚拟机迁移服务器负载节能
- 基于PUSH机制的任务调度方法
- 2016年
- 为降低Hadoop Map Reduce环境中任务的数据访问延时进而提高系统性能,提出一种基于PUSH机制的任务调度方法。该方法根据输入数据分布,主动将任务推送到存储其输入数据的节点。当任务在这些节点执行时,可以直接从本地磁盘读取数据,从而避免远程数据访问延时。该方法已在hadoop-0.20.2中实现,并在真实集群中进行验证。研究结果表明:与原有调度方式相比,该方法可将作业执行时间平均降低8%,在最好情况下可降低14.3%。
- 张霄宏孙江峰赵文涛
- 关键词:数据局部性任务调度MAPREDUCE
- 基于SIR的Device-to-Device移动社交网络信息传播模型被引量:1
- 2019年
- 智能移动设备的迅速普及在加快移动社交网络发展的同时,也给底层通信网络带来了沉重的负担。为了缓解底层通信网络的负担,越来越多的社交网络应用开始采用Device-to-Device技术传播信息。本文以Device-to-Device移动社交网络为研究对象,首先分析该网络中用户参与信息传播的特点,然后在传染病模型的基础上构建适合此网络特点的信息传播模型,并利用该模型分析真实Device-to-Device环境中的信息传播过程。结果表明,Device-to-Device移动社交网络中的信息传播与基于Internet的社交网络中的信息传播有相似之处;但是,由于Device-to-Device移动社交网络存在较大的传播时延,信息在该网络中需要较长的时间才能达到传播高峰。
- 张霄宏钱凯鲍亚雷
- 关键词:信息传播社交网络传染病模型
- 决策树C4.5算法的优化与应用被引量:33
- 2015年
- C4.5算法作为目前最具影响力的决策树分类算法,仍存一些不足之处。针对C4.5算法在对连续值属性离散化处理过程中比较耗时的缺点,基于Fayyad和Irani的边界定理,在连续属性离散化之后使用Gini指标代替信息熵对算法进行了化简。针对决策树算法中的过度拟合问题,基于Occam’s razor,采用再带入估计,对算法进行了改进。将上述思想应用于金融借贷数据,实验结果表明,改进的C4.5算法在保证准确率的前提下,执行时间平均降低8.74%,模型复杂度平均降低6.26%,表明了该算法的有效性。
- 苗煜飞张霄宏
- 关键词:C4.5算法奥卡姆剃刀