数据仓库与ETL

  • 数据仓库

在企业数字化转型的过程中,提到数据,数据中台,绕不开数据仓库,那么什么是数据仓库呢,根据百度百科的说法是:

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

这个数据太官方,其实通俗点就是,面向企业决策,决策靠什么,靠数据,分析报告,那么这些报告是为了做什么呢,质量、成本、效率的提升,说到底数据仓库就是存放这些数据的基础。

对于数据仓库,从数据仓库的架构来说,可以分为 ODS 原始数据层、DWD明细数据层、DWS 轻度汇总层、ADS/DM 应用层/集市层、DM维度。

ODS层,顾名思议,就是通过存放原始数据的地方,那么原始数据,可能来源于外部导入,比如txt、Excel等,以及其他的一些结构化的数据,如mysql,Oracle、sql_server等的数据。

DWD层,明细数据层,是根据一定的规则,进行数据清洗后的,具体清洗规则,会在下部分的ETL中讲解。

DWS层,更多的是基于DWD,以及面向对象层数据,进行聚合等的计算。

ADS/DM层,这块的数据,是为了便

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值