肖仁财
- 作品数:3 被引量:7H指数:2
- 供职机构:江苏大学计算机科学与通信工程学院更多>>
- 发文基金:国家自然科学基金江苏省产业信息化重点基金江苏省高校自然科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 高效的关联规则挖掘算法被引量:4
- 2008年
- 针对Apriori算法多次扫描数据库且生成的候选项集数量大的缺陷,提出了一种数据库优化策略,并结合修剪频繁集和连接优化策略,得到一种新的关联规则挖掘算法-NApriori算法。该算法减小了数据库的规模以及候选项集的数目,避免了连接过程中相同项目的重复比较。实验表明此方法比Apriori算法有更好的性能。
- 郭健美宋顺林肖仁财
- 关键词:数据挖掘关联规则频繁项集事务数据库
- 带数据项约束的序列模式挖掘
- 2008年
- 传统的数据挖掘方法会生成大量的模式和规则,且难以理解,而实际上用户感兴趣的只是其中的一小部分。针对该问题,在挖掘序列模式的PrefixSpan算法基础上提出一种带数据项约束的序列模式挖掘方法,通过数据项约束,减少了搜索空间。实验结果表明,该方法可以有效地挖掘出满足数据项约束的序列模式。
- 肖仁财薛安荣段西强
- 关键词:数据挖掘前缀后缀
- 一种挖掘多维序列模式的有效方法被引量:3
- 2008年
- 提出了一种新的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,在包含此模式的所有元组中的多维信息中挖掘频繁1-项集,由得到的频繁1-项集开始,循环的由频繁(k-1)-项集(k>1)连接生成频繁k项集,从而得到所有的多维模式。该算法通过扫描不断缩小的频繁(k-1)-项集来生成频繁k项集,减少了扫描投影数据库的次数,因而减少了时间开销,实验表明该算法有较高的挖掘效率。
- 肖仁财薛安荣
- 关键词:投影数据库多维序列模式数据挖掘