周娇玲
- 作品数:3 被引量:8H指数:1
- 供职机构:东华大学更多>>
- 发文基金:上海市自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种列存储数据仓库中的数据复用策略被引量:8
- 2013年
- 数据复用是数据仓库管理中节约存储空间、提高查询效率的重要手段.列存储技术将来自同一属性的数据连续存储,极大地提高了数据仓库等分析型应用软件的性能,同时增加了复用的可行性和灵活性.为此,提出了一种列存储数据仓库中的数据复用策略.首先,利用模式匹配技术发掘候选可复用列,排除大量无法复用的数据列,在此基础上对候选可复用数据进行筛选和过滤,大大降低复用数据检测的复杂度.针对确定的可复用数据,提出了基于列存储的复用实现策略,分别给出了原始数据列、压缩数据列及索引数据列的复用实现方法.最后提出了基于复用数据的查询实现技术.在大规模数据仓库基准数据集上的实验结果验证了数据复用策略在减少存储量、节省数据装载时间及提升查询性能方面的有效性.
- 王梅周娇玲乐嘉锦
- 关键词:数据复用数据仓库
- 基于列存储的数据复用研究与实现
- 随着互联网的兴起与飞速发展,大量的信息迎面而来,如何用科学的方法整理数据,从而从不同的视角对各方面信息进行准确判断,比以往更为迫切,更受关注。数据仓库作为数据集成的框架之一,是解决大数据环境下分析型应用问题的有效手段。数...
- 周娇玲
- 文献传递
- 一种列存储数据仓库中的数据复用策略
- 复用是数据仓库管理中节约存储空间、提高查询效率的重要手段.列存储技术将来自同一属性的数据连续存储,极大地提高了数据仓库等分析型应用软件的性能,同时增加了复用的可行性和灵活性.为此,提出了一种列存储数据仓库中的数据复用策略...
- 王梅周娇玲乐嘉锦
- 关键词:数据仓库