湖南省教育厅科研基金(12C0291)
- 作品数:2 被引量:2H指数:1
- 相关作者:郭鑫颜一鸣更多>>
- 相关机构:吉首大学更多>>
- 发文基金:湖南省教育厅科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的不确定树模式聚类算法被引量:1
- 2013年
- 不确定树模式聚类是数据挖掘领域中的一个重要问题,提出了一种新的不确定树模式聚类算法,有效地解决了因数据的不确定性而导致的无法聚类的问题。为了更加准确地度量树模式之间的相似性,提出了一种语义相似度计算方法与结构相似度计算方法。设计了一个动态聚类过程,自适应获取聚类阈值,较大程度上减少了人为干扰导致聚类结果不准确的影响,使得具有相似结构的子树聚集在同一个相似分组中,不同分组之间的子树相似度达到最小化。通过模拟数据和真实环境两部分实验表明,算法有效可行,聚类结果较准确且具有较好的运行效率。
- 颜一鸣郭鑫
- 关键词:数据挖掘有序树频繁子树相似度聚类
- 一种基于Hadoop的动态树增量更新方法被引量:1
- 2014年
- 为适应真实环境中数据量大、流程复杂、计算密集的数据挖掘需求,提高传统树增量更新挖掘效率,改变已有算法的串行执行方式,提出一种基于Hadoop的动态树增量更新方法。介绍云计算、模型与执行流程等基本概念,针对现有Hadoop平台中任务调度的随机分配策略,设计一种动态云平台中的资源调度与分配算法,以期达到成本消耗的最小化,给出树增量更新挖掘算法以及2个并行算法(DeleteFreqTree和FindNewTree),完成树数据的增量挖掘工作。实验结果表明,该并行算法有效可行,具有高效性与良好的扩展率,能够对海量树数据进行更新挖掘。
- 颜一鸣郭鑫
- 关键词:数据挖掘云计算并发控制频繁子树