万军
- 作品数:3 被引量:9H指数:2
- 供职机构:广西大学计算机与电子信息学院更多>>
- 发文基金:国家自然科学基金广西教育厅科研项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于向量的概率加权关联规则挖掘算法被引量:3
- 2014年
- 关联规则挖掘是数据挖掘领域中最活跃的一个分支。目前提出的许多关联规则挖掘算法需要多次扫描数据库并产生大量候选项集,影响了挖掘效率。针对加权关联规则挖掘算法中多次扫描数据库影响算法性能的问题,对其进行了优化,采取了以空间换时间的思路,提出一种基于向量的概率加权关联规则挖掘算法。以求概率的方式设置项目属性的权值,通过矩阵向量存储结构保存事务记录,只需扫描一次数据库,并且采用不同的剪枝策略及加权支持度和置信度的计算方式。使用数据实例进行模拟实验,结果表明此算法明显提高了挖掘效率。
- 赵志刚万军王芳
- 关键词:数据挖掘向量加权关联规则剪枝策略
- 基于OWSFP-Tree的最大频繁项目集挖掘算法被引量:5
- 2013年
- 为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超集检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。
- 赵志刚王芳万军
- 关键词:数据挖掘关联规则最大频繁项目集FP-TREE
- 加权关联规则挖掘算法的研究与改进
- 在信息技术快速发展的时代,各种企业数据也在爆炸式的增长,如何准确、高效地从中发现有潜在价值的信息是人们一直关注的问题。数据挖掘作为一种数据分析工具,用于在海量数据中寻找未知的、创新的、潜在有用的、能够最终被理解的知识或模...
- 万军
- 关键词:加权关联规则哈希函数局部数据库剪枝策略