数仓搭建及项目需求

数仓搭建

业务数据生成

建表语句

  1. 创建数据库
  2. 设置数据库编码
  3. 导入建表脚本,创成表
  4. 导入数据插入脚本,函数脚本,存储过程脚本

业务数据生成

通过函数脚本生成业务数据

业务数据导入数仓

在这里插入图片描述

ODS层

完全仿照业务数据库中的表字段,一模一样的创建ODS层对应表。

DWD层

积压ODS层对数据进行判空过滤。对商品分类表进行维度退化(降维)。

DWS层之用户行为宽表

为什么要建宽表?

需求目标,把每个用户单日的行为聚合起来组成一张多列宽表,以便之后关联用户维度信息后进行,不同角度的统计分析。

  1. 创建用户行为宽表
  2. 导入用户行为数据

项目需求

GMV成交总额

什么是GMV

在这里插入图片描述

转化率

好的,我理解了您的问题。深圳证券交易所数仓搭建项目的架构应该是一个分层的架构,主要包括以下几个层次: 1. 据采集层:这一层主要负责从各个据源采集据并进行初步的清洗和处理。采集的据可以来自于深交所的各个交易系统、证券公司的交易系统、行情据等。据采集层应该支持多种据源和据格式,并具备一定的容错和恢复能力。 2. 据存储层:这一层主要负责对据进行存储和管理。深交所的据量非常大,需要采用分布式存储的方式来满足存储需求据存储层应该支持多种存储技术,包括关系型据库、NoSQL 据库、分布式文件系统等,并具备高可用性和高性能。 3. 据处理层:这一层主要负责对据进行加工和转换,以支持各种分析和查询需求据处理层应该支持多种据处理技术,包括 ETL 工具、据挖掘工具、机器学习工具等,并具备一定的自动化和可配置性。 4. 据应用层:这一层主要负责提供据分析和报告功能,以支持深交所的业务决策和监管职责。据应用层应该支持多种分析和报告工具,包括据可视化工具、报表工具、BI 工具等,并具备一定的交互性和可定制性。 5. 安全和管理层:这一层主要负责据的安全和管理。安全和管理层应该支持多种安全和管理技术,包括身份认证、权限管理、审计跟踪等,并具备一定的可扩展性和可配置性。 以上是一个可能的架构,具体的实现还需要根据实际情况进行进一步的设计和优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值