
数据治理
一凡888
感觉要暴富
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据质量检查,表概况,建表配置项
表概况表英文名 表中文名 默认过滤条件 表概况检查项 S_AYT_AJDSRRYBSGSZY 案件当事人人员表(双公示专用) delete_flag = 0 or del_flag = '' or del_flag is null 数据量、空值率 建表配置项表英文名 表中文名 字段英文 字段中文 源系统数据类型 S层数据类型 O层数据类型 T层数据类型 AYT_AJDSRRYBSGSZY 案件原创 2023-09-01 23:46:13 · 157 阅读 · 0 评论 -
数据质量检查项
案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)原创 2023-09-01 10:34:45 · 154 阅读 · 0 评论 -
数据质量检查配置表(模板)
案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)案件当事人人员表(双公示专用)原创 2023-09-01 10:33:00 · 330 阅读 · 0 评论 -
数据质量核验流程及规范
如果有,则很可能是异常数据。例1:ID、编码字段如果是系统生成的,字符长度不太可能出现长度明显不一致的情况, 如果一个表的ID字段,长度从1到16各种情况都有,并且其中长度为16的有1万条数据,而长度为1到15的都是零零散散几条数据,则长度为1到15的数据很有可能是异常数据。部分日期时间字段是具有业务意义的,比如出生日期,如果该表记录的是历史人物的出生日期,则不需要检查有效性,但如果该表记录的是近几年的医院就诊病人信息,则出生日期不太可能出现1900年之前的,更不可能出现当前日期以后的。原创 2023-07-28 22:11:12 · 1480 阅读 · 0 评论 -
数据治理的概念及其相关
事前:定义数据的规则,统⼀⼝径(⽐如购买途径在业务库那边是什么1234这种,我们需要把它case when 转换成字符串,什么安卓、苹果、⾯谈这类的,年⽉⽇⼩时分钟秒,我这边都转成⼀致的字段) 事中:确认数据的完整性和唯⼀性(⽐如ODS层和业务数据进⾏数据量的对⽐,唯⼀性--count(主 键)和count(distinct主键)校验不等相等就告警了,定期清洗检查)它涉及到制定数据标准、数据分类、数据质量、数据安全等⽅⾯的政策和流程,旨在确保数据在组 织内得到正确使⽤和管理。2. 谈谈你对数据质量的理解?原创 2023-08-08 15:27:56 · 158 阅读 · 0 评论 -
数据治理的意义及方式
答:数据治理中数据治理团队的作用是负责数据治理的规划、实施和监控,包括确定治理目标和策略、建立治理框架 和流程、制定治理规范和标准、实施治理方案和监控治理效果等。答:数据治理中数据治理平台的作用是支持和实现数据治理的各项工作和任务,包括数据资产管理、数据质量控制、 数据安全保护、元数据管理、数据血缘关系追踪等功能。元数据的维护是指更新和维护元数据 的准确性和完整性;答:元数据管理的主要挑战包括元数据的收集和维护困难、元数据的共享和交换困难、元数据的准确性和一致性问 题、元数据的更新和管理成本高等。原创 2023-08-06 00:17:42 · 2471 阅读 · 0 评论