数仓理论|精华整理

本文深入探讨了数据仓库的理论,包括数据仓库的定义、特点、OLTP与OLAP的区别,以及数仓的基础架构模式如ETL。文章还介绍了维度分析、数仓建模(星型和雪花模型)和SCD渐变维。最后,讨论了数仓的分层设计,如ODS、DW和ADS层的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据仓库理论

学习目标

理解OLTP和OLAP的区别

理解数据仓库的特点

理解数据仓库系统架构

理解指标与维度

理解下钻与上卷

理解事实表与维度表

理解星型模型和雪花模型

理解缓慢渐变维

掌握数据仓库的分层方法

数据仓库介绍

数据分析的问题

  1. 做分析的时候,很多业务数据都会分散的存储到很多业务后台中。数据孤岛
  2. 数据量巨大,需要一种能够存储海量数据,同时也能分析海量数据的工具
  3. 工具还需要能够支持常用的SQL

解决问题

  1. 做数据的集中存储
  2. 分布式存储+分布式计算

满足条件的组件

  • Hive

    存储基于分布式的HDFS

    计算基于分布式的MapReduce

  • Impala

    分布式存储 + 分布式计算

  • HAWQ

  • Spark、Flink(分布式计算框架)搭配HDFS(分布式存储)

数仓的简

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIMaynor

觉得有用,要个免费的三连可有?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值