王跃飞 作品数:17 被引量:123 H指数:7 供职机构: 新疆大学信息科学与工程学院 更多>> 发文基金: 国家自然科学基金 新疆维吾尔自治区高校科研计划 新疆维吾尔自治区自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于图像边缘增强与弱化的边缘检测 被引量:12 2019年 为提高边缘算子检测结果的清晰度,在扩充清晰边缘面积上,提出深度探测法以增强邻域边缘;在消除模糊纹理上,用跨越步长Δx和Δy作为模糊纹理和清晰边缘的分界,达到弱化模糊纹理的目的,凸显模糊区域局部对比度;在算法执行效率上,空间复杂度不高,但时间复杂度为O(4n3)。经测试,该算法可实现扩充清晰边界、弱化模糊纹理以及凸显模糊纹理区域对比度的目标,在小于1600*1600分辨率图像上处理速度较佳,但在更高分辨率上计算较久。该方法凸显了边缘分界,可用在其它领域算法预处理阶段。 张晗 钱育蓉 王跃飞 陈人和 田宸玮关键词:边缘检测 PREWITT算子 基于LDA主题模型的移动应用相似度构建方法 被引量:2 2017年 随着移动互联网的快速发展,如何从大量的移动应用中抽取有效的描述信息继而为移动用户提供有效准确的推荐策略变得尤为迫切。目前,移动应用市场对应用的推荐策略相对传统,大多是根据应用的单一属性进行推荐,如下载量、应用名称、应用分类等。针对推荐粒度过粗和推荐不准确的问题,提出了一种基于潜在狄利克雷分布(LDA)主题模型的移动应用相似度构建方法。该方法从应用的标签入手,构造应用的主题模型分布矩阵,利用该主题分布矩阵构建移动应用的相似度矩阵,同时提出了将移动应用相似度矩阵转化为可行的存储结构的方法。实验结果表明该方法是有效的,相比现有的360应用市场推荐的应用其相似度提升130%。该方法解决了移动应用推荐过程中推荐粒度过粗的问题,可使推荐结果更加准确。 褚征 于炯 王佳玉 王跃飞关键词:相似度矩阵 主题模型 隐含信息 标签 基于聚类层次模型的视频推荐算法 被引量:2 2017年 目前推荐系统存在评论数据稀疏、冷启动和用户体验度低等问题,为了提高推荐系统的性能和进一步改善用户体验,提出基于聚类层次模型的视频推荐算法。首先,从相关用户方面着手,通过近邻传播(AP)聚类分析得到相似用户,从而收集相似用户中的历史网络视频数据,进而形成视频推荐集合;其次,利用用户行为的历史数据计算出用户对视频的喜好值,再把视频的喜好值转换成视频的标签权重;最后,通过层次分析模型算出视频推荐集合中用户喜好视频的排序,产生推荐列表。基于Movie Lens Latest Dataset和You Tube视频评论文本数据集,实验结果表明所提算法在均方根误差和决策精度方面均表现出良好的性能。 金亮 于炯 杨兴耀 鲁亮 王跃飞 国冰磊 廖彬关键词:稀疏性 冷启动 聚类分析 基于流网络的Flink平台弹性资源调度策略 被引量:15 2019年 为了解决大数据流式计算平台中存在计算负载波动上升,但集群无法有效应对负载变化的问题,提出了基于流网络的Flink平台弹性资源调度策略(FAR-Flink)。该策略首先建立流网络模型并通过构建算法计算每条边的容量值,其次通过弹性资源调度算法确定集群性能瓶颈并制定动态资源调度计划,最后通过基于数据分簇和分桶管理的状态数据迁移算法,实施调度计划并完成节点间的高效数据迁移。实验结果表明,该策略在状态数据复杂的应用场景中有较好的优化效果,在满足计算时延约束的前提下提高了集群的吞吐量,缩短了状态数据迁移的时间。由此可见,FAR-Flink策略有效提升了集群对负载波动的响应能力。 李梓杨 于炯 卞琛 张译天 蒲勇霖 王跃飞 鲁亮关键词:资源调度 基于内存云的大块数据对象并行存取策略 被引量:3 2016年 由于内存云(RAMCloud)只支持最大1 MB的小块数据对象存储,因此当大于1 MB的对象需要存储在内存云集群中就会受到对象大小的限制,无法在集群中进行存储。为了解决内存云存储限制的问题,提出了基于内存云的大块数据对象并行存取策略。该存储策略首先将大块数据对象分割成若干个1 MB的小块数据对象,然后在客户端生成数据摘要,最后使用并行存储算法将客户端分割成的小块数据对象存储在内存云集群中。读取时首先读取数据摘要,然后根据数据摘要从内存云集群中并行读取小块数据对象,并将小块数据对象合并生成大块数据对象。实验结果表明:大块数据对象的并行存取策略在不破坏内存云集群体系结构的前提下存储时间为16~18μs,读取时间为6~7μs。在Infini Band网络架构下,所提并行算法的加速比呈现类似线性的增长,它使大块数据对象也能够像小块数据对象一样在微秒级别下快速、高效地进行存取。 褚征 于炯 鲁亮 英昌甜 卞琛 王跃飞关键词:存储策略 大数据流式计算环境下的阈值调控节能策略 被引量:4 2017年 在大数据实时分析计算领域,流式计算的重要性不断提高,但是流式计算平台处理数据的能耗不断上升。针对这一问题,改变流式计算中节点对数据的处理方式,提出了一种阈值调控节能策略(ESTC)。首先,根据系统负载差异确定工作节点的阈值情况;其次,通过工作节点的阈值对系统数据流进行随机选择,确定不同数据处理情况调节系统的物理电压;最后,根据不同的物理电压确定系统功率。实验结果和理论分析表明,在20台普通PC机构成的流式计算集群中,实施ESTC的系统比原系统有效节能约35.2%;此外,ESTC下的性能与能耗的比值为0.080 3 tuple/(s·J),而原系统性能与能耗的比值为0.069 8 tuple/(s·J)。ESTC能够在不影响系统性能的前提下,有效降低了能耗。 蒲勇霖 于炯 王跃飞 鲁亮 廖彬 侯冬雪关键词:阈值 系统性能 混合内存云架构的数据对象管理策略 被引量:2 2018年 为有效解决内存云主要存储器件DRAM面临能耗损失大、数据可靠性差、断电易失等问题,提出使用非易失性存储器件PCM替换部分DRAM器件构成混合内存云架构。构建最优分配比模型,在系统总能耗一定的情况下,DRAM和PCM的分配比为4.847∶1时,系统的存储效用最高;通过数据对象预分类模型将数据对象按照读写倾向性分配到内存器件中,构建二室模型对数据对象的迁移和备份速率进行计算,确保系统的稳定性和可靠性。模拟算例结果表明,与相同能耗的内存云架构相比,该混合内存云架构提高了9.37%的存储能力,断电恢复延迟减少15.87%。 岳珊 于炯 鲁亮 王跃飞 蒲勇霖关键词:数据对象 二室模型 基于GraphX的传球网络构建及分析研究 被引量:8 2016年 虽然大数据技术在社交网络、金融、公共安全、医疗卫生等领域的应用不断成熟,但在竞技体育方面的应用还处于探索阶段.常规篮球统计中缺乏对传球数据的记录,更缺乏对传球数据的统计分析、价值挖掘及应用等方面的研究.1)由于传球数据汇聚形态为图,在传球数据获取、数据清洗及格式转化、Vertex与Edge表构建的基础上,通过GraphX构建传球网络图为其应用打下基础;2)提出PlayerRank值区分球员重要度、球员位置个性化图顶点等方法提高传球网络可视化质量;3)通过GraphX构建的传球网络分析传球数量与质量对比赛结果的影响,并例举了传球网络在球队传球数据分析、战术人员选择、临场战术制定、网络子图及游戏体验改进等方面的应用. 张陶 于炯 廖彬 国冰磊 卞琛 王跃飞 刘炎一种基于邻域系统密度差异度量的离群点检测算法 被引量:11 2020年 针对离群点检测算法LOF在高维离散分布数据集中检测精度较低及参数敏感性较高的问题,提出了基于邻域系统密度差异度量的离群点检测NSD(neighborhood system density difference)算法。相较于传统基于密度的离群点检测方法,NSD算法引入了截取距离的概念。首先计算数据集中对象在截取距离内的邻居点个数;其次计算对象的邻域系统密度;然后将对象的密度与它邻居的密度进行比较,判定目标对象与其邻居趋向于同一簇的程度;最后输出最可能是离群点的对象。将NSD算法与LOF、LDOF、CBOF算法在真实数据集与合成数据集中对比实验发现,NSD算法具有较高的检测准确率和执行效率以及较低的参数敏感性,证明了NSD算法是有效可行的。 杜旭升 于炯 陈嘉颖 王跃飞 蒲勇霖 叶乐乐关键词:数据挖掘 离群点检测 基于密度 LOF 基于实时流式计算系统的数据分类节能策略 被引量:4 2017年 为解决实时流式计算中数据存储的能耗问题,采用内存分类存储的思想,提出数据分类策略(data classification strategy,DCS)。将内存存储划分为实时文件区与重复文件区;针对实时文件区中的数据,通过降低预存储区(precharge fast powerdown,PRE zone)的峰值电压,关闭大量的数据节点,使服务器预存储区的部分数据进入不常用文件区,通过布隆过滤器(Bloom filter)过滤重复文件区的重复数据。实验结果表明,该策略在存储方面有效节能约27.2%,提高了系统的效率。 蒲勇霖 于炯 鲁亮 廖彬 王跃飞 罗世奇关键词:能耗 数据分类 节能策略 布隆过滤器