多粒度数据仓库的模式设计与业务关系的代理模型

# 多粒度数据仓库的模式设计与业务关系的代理模型 ## 1. 多粒度数据仓库的模式设计方案 ### 1.1 模式设计方案介绍为了满足多粒度数据存储和查询的需求，提出了以下几种不同的模式设计方案： 1. **单事实表无单独时间维度方案**：该方案使用一个不包含单独时间维度的单事实表来处理不同粒度的数据。事实表包含五个度量：参数 ID（Pi）、任务 ID（Tkid）、时间戳（Ts）、标签（L）和值（Value）。时间戳以 UTC 格式表示值的记录时间，标签表示值的记录频率，即每行的粒度级别。 2. **扩展去规范化时间维度与单事实表方案**：采用扩展的去规范化时间维度和单个事实表的组合。 3. **扩展去规范化时间维度与多事实表方案**：使用扩展的去规范化时间维度和多个事实表，每个事实表对应一个粒度级别。 4. **扩展去规范化时间维度与两个事实表方案**：由扩展的去规范化时间维度和两个事实表组成，一个处理详细数据，另一个处理不同粒度的聚合数据。 5. **扩展规范化时间维度与单事实表方案**：基于扩展的规范化时间维度和单个事实表。 6. **扩展规范化时间维度与多事实表方案**：结合扩展的规范化时间维度和多个事实表。 7. **扩展收缩时间维度与多事实表方案**：采用扩展的收缩时间维度和多个事实表。 ### 1.2 各方案的优缺点 | 方案名称 | 优点 | 缺点 | | --- | --- | --- | | 单事实表无单独时间维度方案 | 存储少、查询处理快、数据加载和管理高效 | 该模型在数据仓库模式设计解决方案中不常见 | | 扩展去规范化时间维度与单事实表方案 | - | - | | 扩展去规范化时间维度与多事实表方案 | 数据处理灵活 | 数据分布不均、操作成本高、查询时连接复杂 | | 扩展去规范化时间维度与两个事实表方案 | 管理、使用、访问和理解简单 | 可能存在错误的可汇总性和数据分布不均 | | 扩展规范化时间维度与单事实表方案 | - | - | | 扩展规范化时间维度与多事实表方案 | - | - | | 扩展收缩时间维度与多事实表方案 | - | 存储方面略逊于平均水平 | ### 1.3 性能评估为了评估这些模式设计方案的性能，进行了单级和多级聚合查询的性能测试。测试指标包括查询时间、查询复杂度（以代码行数衡量）、总体聚合时间和存储使用量。测试环境为 2.0 GHz Intel® Core Duo 处理器、512 MB RAM，运行 Ubuntu 8.04 和 MySQL 5.0.5。每个测试进行 5 次，舍弃最大值和最小值，取中间三个值的平均值。 - **单粒度查询处理率**：各方案的处理率在 110,000 至 300,000 行/秒之间，其中单事实表无单独时间维度方案（组合 1）表现最佳。 - **多粒度查询处理率**：处理率在 20,000 至 300,000 行/秒之间，组合 1 再次表现最佳，组合 2 和 4 由于所需的 JOIN 和 UNION 子句较少，表现也较好。组合 3

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

多粒度数据仓库的模式设计与业务关系的代理模型

相关推荐

专栏目录

多粒度数据仓库的模式设计与业务关系的代理模型

相关推荐

数据仓库与数据集市建模

数据仓库与数据挖掘复习.docx

《数据仓库与数据挖掘》复习.doc

数据仓库与数据挖掘考试习题汇总

数据仓库与数据挖掘考试习题汇总.docx

数据仓库建模与ETL的实践技巧

数据仓库维度建模笔记

数据仓库建模与ETL实践技巧(重要)

数据仓库与数据挖掘基础概念解析

数据仓库与数据挖掘考试重点整理

ARM GPU mali系列产品规划图或天梯图

Go语言基于泛型与模糊测试的高性能缓存库设计：LRU与LFU策略的通用Cache实现及优化

专栏目录

最新推荐

网络性能评估必修课：站点调查后的测试与验证方法

【编程语言选择】：选择最适合项目的语言

【统一认证平台集成测试与持续部署】：自动化流程与最佳实践

RTC5振镜卡固件升级全攻略：步骤详解与风险控制技巧

案例研究：揭秘某大型项目如何缩短交付周期

【打印机响应时间缩短绝招】：LQ-675KT打印机性能优化秘籍

【飞行模拟器的虚拟现实整合】：将F-16配平模拟融入VR，开启飞行新纪元！

【Flash存储器的数据安全】：STM32中的加密与防篡改技术，安全至上

OPCUA-TEST与机器学习：智能化测试流程的未来方向！

【震动与机械设计】：STM32F103C8T6+ATT7022E+HT7036硬件震动防护策略