作者:数据峰哥 编辑:数据社
全文共1387个字,建议3分钟阅读
大家好,我是峰哥~,今天跟大家聊聊数据治理的一些事情。
绝大数公司建立数仓之初是没有考虑好数据治理怎么做的,因为数据部门刚开始成立,必然要有一些“数据驱动”的成果,而数据治理不能很好的体现这些业绩。所以,都是在业务发展的过程中,逐渐遇到了一些数据问题,才考虑做这件事的。
01
如何开始数据治理?
首先从数据管理开始,在开始数据治理之前,我们要先梳理数仓的核心资产。从数据的采集到数据的加工,再到数据的应用(包括数仓报表数据、指标数据)。
那么对于业务数据源,我们要明确数仓中主要的数据源都来自哪些业务系统,哪些关键流程,明确关键来源数据的数据负责人,结合业务制定数据管理规范。
02
数仓数据治理的思路
数仓的数据治理可以从以下几个关键点入手:数据目录重新划分,提高模型复用度,ETL任务优化、数据质量监控。