您的位置: 专家智库 > >

文献类型

  • 3篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 4篇自动化与计算...
  • 1篇理学

主题

  • 4篇关联规则
  • 3篇均匀分布
  • 3篇不确定数据
  • 2篇时间序列
  • 2篇数据挖掘
  • 2篇频繁项
  • 2篇频繁项集
  • 2篇项集
  • 2篇粒度
  • 2篇降维
  • 2篇降维方法
  • 2篇关联规则挖掘
  • 2篇关联规则挖掘...
  • 2篇规则挖掘算法
  • 2篇不确定性
  • 2篇查询
  • 1篇数据集
  • 1篇统计学
  • 1篇匿名
  • 1篇频繁项集挖掘

机构

  • 6篇东华大学

作者

  • 6篇陈爱东
  • 5篇刘国华
  • 3篇肖瑞
  • 3篇万小妹
  • 2篇周宇
  • 2篇费凡
  • 2篇宋转
  • 1篇石丹妮

传媒

  • 1篇计算机研究与...
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇第30届中国...
  • 1篇2013年全...

年份

  • 2篇2014
  • 4篇2013
6 条 记 录,以下是 1-6
排序方式:
满足均匀分布的不确定数据关联规则挖掘算法被引量:18
2013年
云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件.首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item-sets,UFI-DM)和关联规则生成子算法(algorithm for generating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性.
陈爱东刘国华费凡周宇万小妹貟慧
关键词:数据挖掘关联规则频繁项集
均匀分布下不确定数据的关联规则变粒度查询被引量:2
2013年
云计算为大数据的关联规则挖掘与查询提供了平台。为防止隐私泄漏,大数据中往往包含人为添加的不确定因素,如何使用户对不确定数据的关联规则挖掘结果查询透明化是大数据挖掘结果查询亟待解决的问题。在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则挖掘结果集的变粒度查询提供便利。首先,通过UFIDM算法进行挖掘并构建关联规则库,为提高查询效率,对泛化标识符和敏感属性分别构建Hilbert packed R树索引。在此基础上,提出了泛化值粒度转换方法和U-ARS查询算法。最后,通过理论分析和实验比对,展示了算法的可行性和有效性。
陈爱东刘国华肖瑞万小妹石丹妮
关键词:大数据关联规则
K-匿名数据集的挖掘算法研究
随着大数据时代的到来,Internet时时刻刻都在释放出海量数据。信息的日积月累,无论是围绕着企业的商业决策,还是个人的生活消费习惯等信息,都变成了以各种各样形式存储的数据。大数据的背后隐藏着大量政治和经济利益的同时,也...
陈爱东
关键词:关联规则数据挖掘
文献传递
满足均匀分布的不确定数据关联规则挖掘算法
算为大数据提供了展示和共享的平台为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这...
陈爱东刘国华费凡周宇万小妹貟慧
关键词:不确定数据精度控制
不确定时间序列的统计降维方法被引量:3
2014年
由于不确定时间序列的长度很长,并且每个采样点的取值具有不确定性,导致了维度灾难和庞大的可能世界集,给不确定时间序列相似性匹配带来了巨大的困难,因此对不确定时间序列降维是实现对其方便存储、快速查询和相似性匹配的首要任务。不确定时间序列普遍采用小波变换的降维方法,但是该方法没有考虑到采样点之间的相关性。为解决该问题,提出一种基于概率统计和数据相关性的降维方法,该方法将不确定时间序列分为概率维度和时间维度,并分别对两维度进行降维。在时间维度,根据采样点之间的相关性,使用某个采样点代表后续相关度高的采样点;在概率维度,使用大概率点表示相邻的小概率点。实验效果表明:使用该方法对不确定时间序列进行降维后,降维序列可以保持原序列的变化趋势,压缩程度显著,并且可近似地恢复原序列。
肖瑞刘国华陈爱东宋转
关键词:时间序列不确定性降维
不确定时间序列的统计降维方法
由于不确定时间序列的长度很长,并且每个采样点的取值具有不确定性,导致了维度灾难和庞大的可能世界集,给不确定时间序列相似性匹配带来了巨大的困难,因此对不确定时间序列降维是实现对其方便存储、快速查询和相似性匹配的首要任务.不...
肖瑞刘国华陈爱东宋转
关键词:统计学时间序列不确定性降维方法
文献传递
共1页<1>
聚类工具0