大数据技术：数据仓库主题建模解析

版权申诉

PPTX文件

数据仓库

数据建模

270KB | 更新于2024-06-26 | 77 浏览量 | 举报收藏

限时特惠：#14.90

本次分享主要围绕大数据技术中的数据仓库主题建模进行探讨，涉及DW建模的基本原则，包括简单性、完整性、高效性和通用性。此外，还详细讲解了事实表和维表的概念，以及不同粒度的事实表类型，以及维表的分类，特别是层级维和退化维。最后，讨论了星型模型的优势，ODS与数据仓库的区别，以及数据仓库中的数据层次和数据保留策略。在大数据领域，数据仓库是关键组成部分，用于支持决策分析。数据仓库的建模原则确保了数据的易用性、完整性和性能。简单性意味着模型设计应便于分析和展示，避免复杂的OLTP数据结构。完整性要求在建模过程中不能丢失任何业务信息。高效性则关注查询速度，通过优化模型减少连接操作以提高查询效率。通用性强调采用业界标准，如星型模型，以便使用常见商业BI工具进行数据分析。事实表是数据仓库的核心，包含维键和度量，提供分析的数据基础。维表则存储属性信息，提供上下文。在某些情况下，一个表可能同时作为事实表和维表。事实表的颗粒度决定了数据的详细程度，分为事务粒度、周期快照粒度和累计快照粒度等类型，每种粒度对应不同的业务场景。维表主要包括层级维和单级维，层级维具有层次结构，如地理区域的国家-省份-城市；退化维是指那些没有关联维度表，直接与事实表连接的列。星型模型通过简化和冗余，将复杂的模型转化为易于分析的形式，例如销售主题表、产品维表、客户维表和日期维表构成的典型星型结构。 ODS（操作数据存储）是介于源系统和数据仓库之间的一个中间层，它集成来自不同源的数据，提供实时或近实时的数据视图。与数据仓库相比，ODS的数据是可变的，反映当前状态，而数据仓库的数据通常是静态的，用于历史分析。ODS的数据保留期限较短，通常不超过几个月，而数据仓库可以长期保留数据，包括原始和汇总数据。通过理解这些基本概念和技术，我们可以更好地设计和利用大数据环境下的数据仓库，以支持高效的业务洞察和决策。

再议星型结

构

通过冗余的方法，尽可能把雪花或其他复杂模型转变成星型模

型

产品ID

客户ID

日期ID

销售金额

产品ID

类别

大类别

供应商

日期ID

日

月

季

年

客户ID

客户名称

市名

省名

国名

销售主题

表

产品维

表

客户维

表

日期维表

星型模型 Star Schema

供应商ID

供应商名称

信用等级

电话

剩余22页未读，继续阅读

passionSnail

粉丝: 681

大数据技术：数据仓库主题建模解析

数据仓库建模技术.pptx

大数据技术分享 数据仓库应用实现 数据仓库实例 共32页.pptx

大数据技术分享 数据仓库与数据挖掘 BI商业数据分析 数据仓库建模技术 共17页.ppt

大数据技术分享 数据仓库与数据挖掘 BI商业数据分析 数学建模专题培训 大数据技术基础知识 大数据挖掘 共68页.pptx

大数据技术分享 数据仓库与数据挖掘 BI商业数据分析 Oracle数据仓库解决方案 共99页.pptx

大数据技术分享 数据仓库与数据挖掘 BI商业数据分析 数据与数据探索 共65页.pptx

大数据技术分享 数据仓库与数据挖掘 BI商业数据分析 云计算与数据挖掘 共116页.pptx

大数据技术分享 Teradata数据仓库技术架构及方案 共60页.pptx

腾讯大数据技术 社交网络大数据建模的框架探索 共37页.pptx

大数据技术分享 金融投资大数据实践分享 共28页.pptx

大数据技术分享 大数据技术与产业综述 共56页.pptx

大数据技术分享 数据架构演进 淘宝在线交易数据演变 共57页.pptx

大数据技术分享 数据资产管理-大数据时代的掘金术 共24页.pptx

大数据技术分享 大数据，大决策 共9页.pptx

大数据技术分享 无线大数据 手机移动端大数据实践 数据采集与分析 共21页.pptx

大数据技术分享 从数据挖掘商业洞察力 共12页.pptx

大数据技术分享 百度-百度大数据引擎 共25页.pptx

大数据技术分享 数据挖掘技术 BI商业数据分析 推荐系统和个性化 共162页.pptx

大数据技术分享 Hadoop技术分享 淘宝HBase技术 共14页.pptx

大数据技术分享 事件驱动的移动数据中心 共34页.pptx

宏基AS6530笔记本电脑完整时序(广达代工)

### 【数据挖掘与可视化】基于Python的数据预处理与可视化：豆瓣电影Top 250数据分析及可视化设计

最新资源

大数据技术分享数据仓库应用实现数据仓库实例共32页.pptx

大数据技术分享数据仓库与数据挖掘 BI商业数据分析数据仓库建模技术共17页.ppt

大数据技术分享数据仓库与数据挖掘 BI商业数据分析数学建模专题培训大数据技术基础知识大数据挖掘共68页.pptx

大数据技术分享数据仓库与数据挖掘 BI商业数据分析 Oracle数据仓库解决方案共99页.pptx

大数据技术分享数据仓库与数据挖掘 BI商业数据分析数据与数据探索共65页.pptx

大数据技术分享数据仓库与数据挖掘 BI商业数据分析云计算与数据挖掘共116页.pptx

大数据技术分享 Teradata数据仓库技术架构及方案共60页.pptx

腾讯大数据技术社交网络大数据建模的框架探索共37页.pptx

大数据技术分享金融投资大数据实践分享共28页.pptx

大数据技术分享大数据技术与产业综述共56页.pptx

大数据技术分享数据架构演进淘宝在线交易数据演变共57页.pptx

大数据技术分享数据资产管理-大数据时代的掘金术共24页.pptx

大数据技术分享大数据，大决策共9页.pptx

大数据技术分享无线大数据手机移动端大数据实践数据采集与分析共21页.pptx

大数据技术分享从数据挖掘商业洞察力共12页.pptx

大数据技术分享百度-百度大数据引擎共25页.pptx

大数据技术分享数据挖掘技术 BI商业数据分析推荐系统和个性化共162页.pptx

大数据技术分享 Hadoop技术分享淘宝HBase技术共14页.pptx

大数据技术分享事件驱动的移动数据中心共34页.pptx