
数据仓库
文章平均质量分 80
胖胖胖胖胖虎
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DWS层新增指标处理方案
业务逻辑确认: 与业务方或需求方深入沟通,清晰定义新指标的计算公式、统计口径(维度、粒度)、业务含义、是否允许为空、默认值是什么。数据来源确认: 确定计算该指标所需的最细粒度数据来源:是否完全依赖现有 DWS 层数据即可计算?(最理想情况,影响最小)是否需要依赖 DWD (Data Warehouse Detail) 层的明细数据?(需要向下追溯)是否需要依赖 ODS (Operational Data Store) 层或其他外部数据源?(影响较大,需评估数据质量和接入)历史数据要求。原创 2025-06-12 18:11:31 · 669 阅读 · 0 评论 -
Apache Gravitino 元数据管理
元数据管理原创 2024-11-06 00:44:24 · 1413 阅读 · 0 评论 -
揭露数据不一致的利器 —— 实时核对系统
随着企业业务发展,以及微服务化大趋势下单体服务的拆分,服务间的通信交互越来越多。与单体服务不同,微服务间的数据往往需要通过额外的手段来保障一致性,例如事务消息、异步任务补偿等。除了从机制上最大程度保障以外,如何观测并及时发现数据不一致也非常重要。本文介绍 Shopee Financial Products 团队设计和开发的实时核对系统(Real-time Checking System)转载 2025-03-02 11:02:17 · 160 阅读 · 0 评论 -
企业微信——智能表格学习
企业微信报表原创 2025-01-03 14:04:27 · 5302 阅读 · 0 评论 -
用户商品推荐
商品推荐转载 2024-10-23 11:46:47 · 166 阅读 · 0 评论 -
数值治理学习记录
数据治理原创 2024-07-02 17:29:47 · 228 阅读 · 0 评论 -
详解数据治理体系
数据治理转载 2024-07-02 15:37:06 · 186 阅读 · 0 评论 -
How to develop an enterprise data warehouse from scratch to foster a data-driven culture
data warehouse翻译 2024-06-21 17:16:36 · 163 阅读 · 0 评论 -
hive 元数据管理系统
hive sql 血缘原创 2023-08-03 17:41:42 · 128 阅读 · 0 评论 -
增量表、全量表、拉链表的应用场景及优缺点详解
事实——增量表、全量表、拉链表、快照表转载 2023-09-26 11:24:45 · 3419 阅读 · 0 评论 -
数仓概念 | 逻辑 | 物理模型
数仓概念模型、逻辑模型、物理模型转载 2023-09-10 23:33:36 · 138 阅读 · 0 评论 -
实时数仓新选择——Doris构建实时数仓落地方案详解
doris 构建实时数仓落地方案转载 2023-07-13 10:24:38 · 4234 阅读 · 0 评论 -
T+1 与 T-1 区别
T+1与T-1的区别主要是看数据的角色视角不同。原创 2023-06-20 15:01:04 · 5884 阅读 · 0 评论 -
flink + Atlas 任务数据血缘调通
Flink atlas原创 2023-06-14 16:23:52 · 1569 阅读 · 8 评论 -
Apache Griffin 记录
apache griffin 数据质量解决方案原创 2023-03-09 09:38:38 · 12 阅读 · 0 评论 -
数据仓库建模样例
数据仓库样例转载 2022-09-29 15:13:14 · 496 阅读 · 0 评论 -
atlas 记录
atlas原创 2022-09-08 14:20:30 · 87 阅读 · 0 评论 -
QPS和TPS是什么
QPS TPS转载 2022-08-29 11:18:23 · 13270 阅读 · 0 评论