宗俊省
- 作品数:6 被引量:3H指数:1
- 供职机构:燕山大学信息科学与工程学院更多>>
- 发文基金:河北省博士后基金博士科研启动基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 数据仓库中实化视图选择方法的研究
- 数据仓库中的视图选择在很大程度上影响数据仓库的查询效率和维护代价,是数据仓库中研究的重要内容.通过对现有的选择实化视图的价值模型进行研究,提出了一个新的视图价值估算模型和视图选择算法——PBPUS算法.该视图选择方法通过...
- 任家东李志国宗俊省
- 关键词:数据仓库实化视图预处理
- 文献传递
- 一种基于规则表达式约束的序列模式增量式挖掘算法被引量:1
- 2007年
- 序列模式挖掘是数据挖掘中的研究热点之一。在挖掘过程中需要用户的参与日益显得重要。为了提高挖掘过程中的交互性,本文提出了一个基于规则表达式约束的序列模式增量式挖掘算法RE_IncUp。该算法首先利用约束对已经挖掘出的频繁序列模式进行预处理,缩小了搜索范围;然后采用模式扩展方法把规则表达式约束和增量挖掘过程融为一体,并且采用先修剪后计算支持度的方法进一步缩小了搜索范围,降低了支持度的计算量。该算法允许用户不断改变约束条件,实现交互式挖掘而且可将挖掘的目标仅仅聚焦到用户感兴趣的模式上。实验表明该算法对序列模式的维护和满足用户的需求都是十分有效的。
- 任家东宗俊省
- 关键词:数据挖掘增量式挖掘
- 一种实现偏序约束条件下的序列模式挖掘算法
- 2007年
- 在序列模式挖掘应用中,约束是非常重要的。本文提出了一种新的约束-偏序约束,允许事务之间的间隔可以是无穷大。但是,本文间隔约束中事务之间的间隔只能是整数,所以可以把偏序约束看成是间隔约束的扩展。针对这个问题,提出了一种新颖的算法SPM(Sequential Pattern Maintenance,简称SPM)算法来解决偏序约束,采用含蓄分割技术把不满足偏序约束的数据序列分割出去,充分利用已挖掘出来的信息来解决由于数据序列数目变小使得支持度值变小的复杂情况。实验表明,SPM算法能够快速可扩展地挖掘出所有满足约束的频繁序列模式。
- 任家东宗俊省李志国
- 关键词:数据挖掘
- 数据仓库中实化视图选择方法的研究
- 数据仓库中的视图选择在很大程度上影响数据仓库的查询效率和维护代价,是数据仓库中研究的重要内容.本文通过对现有的选择实化视图的价值模型进行研究,提出了一个新的视图价值估算模型和视图选择算法--PBPUS算法.该视图选择方法...
- 任家东李志国宗俊省
- 关键词:数据仓库实化视图预处理
- 文献传递
- 基于特征值的数据仓库主题搜索算法
- 1 引言数据仓库的目的是要建立一种体系化的数据存储环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、统一的信息,企业内不同单位的成员都可
- 任家东李志国宗俊省刘欣
- 关键词:SUBJECT
- 文献传递
- 基于约束的序列模式挖掘算法的研究
- 现有的序列模式挖掘算法能有效地在大型数据库中挖掘出完整的序列模式集。然而,随着应用领域越来越细化,用户对挖掘出来的序列模式提出了更高的要求。因此,将用户的要求或兴趣转化成一种或多种约束,来限定挖掘的序列模式是序列模式挖掘...
- 宗俊省
- 关键词:数据挖掘序列模式挖掘算法
- 文献传递