庄晓青
- 作品数:7 被引量:49H指数:3
- 供职机构:东南大学计算机科学与工程学院更多>>
- 发文基金:国家高技术研究发展计划江苏省高技术研究计划项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种可扩展的OLAP服务系统设计方案被引量:2
- 2002年
- 本文提供了一种通用的OLAP服务系统设计方案,该方案能支持不同的DBMS厂商开发的OLAP服务器产品,具有较好的可扩展性和灵活性,用户可根据实际情况选择OLAP服务器产品。为实现这一目标,引入了自定义的查询模式语言,在前端工具和特定的OLAP服务器产品之间起语义转化的作用。
- 虞晓清庄晓青董逸生
- 关键词:OLAP数据仓库数据库系统
- 模糊聚类在Web信息检索中的应用研究被引量:6
- 2002年
- 如何从大量信息中快速、有效地进行Web信息检索已经成为一项重要的研究课题。但是传统的搜索引擎所提供的搜索结果仅仅按照与查询的相关性从高到低排成一个有序列表,不具备层次性,用户使用起来并不方便。该文基于Web资源中词语的不分明性即模糊性,提出采用模糊聚类的方法自动组织搜索引擎的结果来解决这个问题。
- 何鹏徐立臻庄晓青
- 关键词:模糊聚类WEB信息检索搜索引擎INTERNET
- ETL过程逻辑描述及其执行
- 随着数据仓库的广泛建立,数据仓库系统的核心—用于数据仓库数据加载和刷新维护的ETL工具越来越重要.市场上存在大量的ETL工具,这些ETL工具采用不同的实现技术,对应的ETL过程定义描述都基于数据源的数据模型和执行ETL过...
- 庄晓青
- 关键词:统一数据模型数据转换数据清理元模型逻辑描述
- 文献传递
- 多维数据仓库系统中高性能DCA-Tree Cube的研究被引量:3
- 2003年
- 提出了利用R*-tree改进的DCA-tree(data cube aggregate-tree)来创建高性能的DCA-tree cube聚集cube,阐述了创建DCA-tree cube、DCA-tree cube增量更新和MOLAP快速查询等关键技术.算法分析表明,所提出的DCA-tree cube在查询和更新效率方面要比以往DDC等方法创建的cube要高,解决了在插入新维数据时cube增量的更新维护.
- 胡孔法董逸生徐立臻庄晓青杨科华
- 关键词:CUBE多维联机分析处理范围查询
- 数据仓库中的数据集成转换被引量:5
- 2003年
- 本文首先提出了数据仓库中数据集成的一个总体框架,然后列举了在数据转换中可能遇到的主要问题最后根据这些转换规则,给出了一种描述性脚本语言来描述这些规则,继而给相应的处理模块解析处理。
- 薛惠忠庄晓青董逸生
- 关键词:数据仓库数据集成数据转换数据库数据源
- 图书馆大规模日志数据的快速聚类被引量:3
- 2003年
- 给出了一种简单有效的算法,用于对图书馆大规模日志数据的快速聚类和借阅趋势分析.首先,根据读者基本的借阅规律,把日志数据聚成若干子类,然后,给出了对子类结果进行再次聚类的模糊算法.最后,为了预测读者的借阅趋势,对每一类进行了回归分析.该算法具有线性复杂度,对大规模数据集是可伸缩的,实验证明是可行的.
- 宋爱波庄晓青何洁月业宁董逸生
- 关键词:数字图书馆日志数据聚类算法模糊算法借阅规律
- 数据清理及其在数据仓库中的应用被引量:30
- 2003年
- 数据仓库是为决策服务的,这里的数据是从各种异构的数据源中采集过来的。由于各个数据源中的数据可能存在错误以及种种不一致性,因而为了确保决策数据的质量必须要对各个数据源中抽取出来的数据进行清理转换。数据清理就是发现数据源中数据的错误并加以清除或修改,发现和纠正数据源之间数据的不一致性。分析了数据清理概念和方法以及在数据仓库中的应用。
- 庄晓青徐立臻董逸生
- 关键词:数据仓库数据清理