福建省自然科学基金(S0650013) 作品数:4 被引量:24 H指数:3 相关作者: 陈晓云 詹艳艳 徐荣聪 胡运发 刘婷 更多>> 相关机构: 福州大学 复旦大学 更多>> 发文基金: 福建省自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
N个最频繁项集挖掘算法 被引量:6 2007年 频繁项集挖掘算法的计算复杂性和生成的频繁项集数量随着事务集项数的增加呈指数增长,最小支持度阈值成为控制这种增长的关键.然而,实际应用中仅使用支持度阈值难以有效控制频繁项集的规模.为此定义 N 个最频繁项集挖掘问题,并提出基于支持度阈值动态调整策略的宽度优先搜索算法 NApriori 和深度优先搜索算法IntvMatrix 挖掘 N 个最频繁项集.实验表明,本文的2种方法的效率比朴素方法高2倍以上,特别当 N 值较低时,本文方法的效率优势更为明显. 陈晓云 胡运发关键词:数据挖掘 支持度阈值 基于符号化表示的时间序列频繁子序列挖掘 被引量:3 2008年 提出一种新的基于符号化表示的时间序列频繁子序列的挖掘算法。利用基于PAA的分段线性表示法进行降维,通过在高斯分布下设置断点,实现时间序列符号化表示,利用投影数据库挖掘频繁子序列。该算法简单、新颖,运行快速,简化了子序列支持数的计算。 胡晓琳 陈晓云关键词:数据挖掘 时间序列 符号化 基于逆云模型的支持向量机多类分类方法 被引量:4 2008年 针对支持向量机在进行多类识别中存在的拒分问题,结合能够描述客观世界不确定性的模糊理论,提出利用逆云模型描述样本对各类逆云隶属度的多类分类方法.实验表明,该方法能够有效地消除样本拒分现象,提高识别率. 刘婷 陈晓云关键词:支持向量机 基于插值边缘算子的时间序列模式表示 被引量:11 2007年 借鉴数字图像领域中边缘算子的基本思想,提出一种基于插值边缘算子的时间序列分段线性表示方法(简称为 IEO 表示).该方法根据插值边缘算子中的两个子度量:边缘强度和插值误差相结合的度量标准来选取时间序列模式表示中每个子模式的边缘点(端点).时间序列的 IEO 表示不但可以压缩数据,还可以有效抑制噪声的影响,因而具有较强的适应性,可以适应不同的数据特征环境. 詹艳艳 徐荣聪 陈晓云关键词:插值误差 时间序列 分段线性表示 压缩率