宋少英
- 作品数:3 被引量:10H指数:2
- 供职机构:燕山大学信息科学与工程学院更多>>
- 发文基金:河北省教育厅科研基金教育部科学技术研究重点项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于OUS的最大频繁项集挖掘算法
- 2008年
- 分析实际应用中有效访问序列的特点,提出了一种采用自底向上策略快速挖掘最大频繁项集的OUS算法。该算法首先对用户项集进行重叠操作统计浏览次数,然后合并,依据用户给出的最小支持度删除原项集中的非频繁页面元素,并对两两用户项集筛选生成候选频繁项集,最后扫描数据库,统计各个候选频繁项集的支持度计数。实验结果表明,该算法能有效地发现用户最大频繁项集。
- 张忠平宋晓辉宋少英
- 关键词:最大频繁项集
- ISAD:一种新的基于属性距离和的孤立点检测算法被引量:7
- 2009年
- 孤立点是数据对象在某些属性(维)上波动形成的。由此,本文提出了关键属性的概念,用于描述影响数据稳定性的属性。在真实数据集中,只有一部分属性是能够决定某数据是否是孤立点的关键属性。由此,本文提出了关键属性隶属度的定义及其求解算法,并在此基础上提出了一种新的基于属性距离和的孤立点检测算法。实验结果表明,该算法较基于单元的算法在效率及维数可扩展方面均有显著提高。
- 张忠平宋少英宋晓辉
- 关键词:孤立点
- 基于PCA及属性距离和的孤立点检测算法被引量:4
- 2009年
- 提出了一种基于主分量分析和属性距离和的孤立点检测算法。该方法首先通过主分量分析方法从众多属性中提取出满足累计贡献率的主分量,同时利用PCA变换矩阵把原始数据集转换到由主分量组成的新的特征空间上,之后对转换后的数据集用属性距离和的方法对孤立点进行检测。实验结果证明了基于主分量分析和属性距离和的孤立点检测算法的有效性。
- 张忠平宋少英宋晓辉
- 关键词:孤立点主分量分析