杨健
- 作品数:2 被引量:7H指数:2
- 供职机构:电子科技大学更多>>
- 发文基金:四川省科技支撑计划中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于主观兴趣度的关联规则优化算法被引量:2
- 2013年
- 基于兴趣度的规则优化算法通过整合用户领域知识,对规则进行了精简和优化,有效地帮助了用户发现其最感兴趣的规则。但算法仍存在兴趣度计算方式欠妥、用户含义表达受限等问题。提出对兴趣度计算方法的改进,对单模板情况下的计算进行分类讨论,解决了兴趣度计算不合理的问题。同时,新算法引入复合模板的技术,支持对规则的多维分析,丰富了用户含义的表达。通过2组对比实验验证,改进后的基于主观兴趣度的规则优化算法能导出更加合理的兴趣度排序结果,给用户提供更有价值的规则参考。
- 牛新征杨健周明天
- 关键词:关联规则兴趣度
- 基于数组前缀树的频繁项集挖掘算法被引量:5
- 2014年
- 频繁项集挖掘算法研究的焦点是不断提升算法在海量数据集上的挖掘性能.其中,基于前缀树的挖掘算法FP-Growth是目前研究的焦点之一,它在挖掘性能上有很大的改进空间,因此基于数组技术的FP-Growth*与基于被约束子树的STmine等改进算法被提出.这些算法有效提升了挖掘速率,但在搜索策略与计数方式两个方面仍存在可完善的地方.本文提出基于数组前缀树的频繁项集挖掘算法AFP-Growth.该算法使用新的遍历策略解决了FP-tree的项节点变换问题,完善了数组前缀树的构建过程以提升其计数效率,并且用数组前缀树代替FP-tree,减少了对树的遍历时间.通过实验验证表明,改进后的AFPGrowth算法在多数真实数据集上具有比FP-Growth*等其他高效算法更佳的挖掘性能,不仅减少了挖掘时间,也降低了内存消耗,体现了其对海量数据集挖掘的潜能.
- 牛新征杨健佘堃
- 关键词:关联规则频繁项集FP-GROWTH