数据仓库维度建模

(一)、事实表类型
事实表根据粒度的角色划分不同,可分为事务事实表、周期快照事实表和累计快照事实表。
1、事务事实表
用于承载事务数据,通常粒度比较低,例如产品交易事务事实、ATM交易事务事实。
2、周期快照事实表
用于记录有规律的、固定时间间隔的业务累计数据,通常粒度比较大,例如账户月平均余额事实表。
3、累计快照事实表
用于记录具有时间跨度的业务处理过程的整个信息,通常这类事实表相对比较少见。

(二)、星型模型和雪花模型
在维度建模中,存在两种组合维度表和事实表的基本模型:星型模型和雪花模型。
1、星形模型
当所有维度表直接连接到事实表时,整个组合的形态类似于星星,所以被称为星形模型。
星形模型是一种非规范的结构,其数据存储存在冗余,比如考虑商品的维度表,其品牌信息在商品的每一行中都存在,包括其中品牌ID、名称、品牌拥有者等。通常很多商品的品牌都是一样的,所以在商品维度表中品牌的信息被重复存储了很多次,也就是存在冗余。
2、雪花模型
当有一个或者多个维度表没有直接连接到事实表,而是通过其他维度表连接到事实表上时,整个组合的形状就像雪花一样,这种架构被称为雪花模型。
雪花模型是对星形模型维度表的规范化,比如上述的商品表例子,在雪花模型中,其每一行仅存储品牌ID,而品牌的所有模型其他信息(包括品牌名称、拥有者、注册地等所有描述信息)都存储在单独的品牌维度表内。通过品牌ID这个外键,商品表可以间接获得所有品牌描述信息。
雪花模型去除了数据冗余,节省了部分存储,但是也给下游用户的使用带来了不便,如下游用户需要分析品牌的销售额,必须自己先用订单表关联商品表,然后用商品表再关联品牌表。正式由于这一点,在维度建模的实际中,雪花模型很少使用。

(三)、维度建模一般过程
维度建模一般采用具有顺序的4个步骤来进行设计,即选择业务过程,定义粒度,确定维度和确定事实。
1、选择业务过程
业务过程即企业和组织的业务活动,它们一般都有相应的源头业务系统支持。对于一个超市来说,最基本的业务活动就是用户收银台付款;

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值