
数据仓库上游系统调研与贴源层分析
下载需积分: 50 | 2.4MB |
更新于2024-09-05
| 3 浏览量 | 3 评论 | 举报
收藏
"该文档是2019年8月28日关于数据仓库贴源层的演示,主要内容涉及数据仓库入仓表的分析规则,上游系统现状的调研,以及如何选择适合入仓的业务表。文档提到了缓冲存储层的作用,数据质量检验的策略,以及入仓系统的初步筛选标准。"
数据仓库是存储和管理大量结构化数据以支持业务智能、数据分析和决策制定的系统。在数据仓库的设计中,贴源层或近源层扮演着重要角色,它位于数据源和数据仓库的其他层次之间,旨在提供一个可供查询的、快速访问的数据副本,同时保护原始数据源不受频繁读取和误操作的影响。
贴源层的设计目的是减少对上游系统的性能负载,允许数据重跑,并且通常保持与源系统相似的表结构,添加额外的信息如源系统标识、ETL日期和供数方式。在数据质量检验方面,包括成功标识、系统名校验、表校验、字段对比、数据量、分区和历史缓慢变化维的检查,确保数据的准确性和一致性。
文档中提到的首批九个入仓系统名单,以及后续的约41个入仓系统的选择过程,展示了数据仓库构建过程中严谨的系统评估。在选择入仓系统时,需要考虑系统的字典版本、数据库连接信息、系统是否仍在运行、数据字段的用途和必要性等因素。例如,字段级的分析排除了无意义的字段(如空字段、固定值字段、加载时间等)、业务上不使用的长文本、流程控制字段、中间计算结果、未启用字段、冗余字段和非结构化数据。
对于上游系统表的业务含义和下游用途的理解至关重要。数据仓库系统定位为提供服务给各类内部应用、OLAP分析、BI系统,重点关注那些关键业务数据、保留粒度较细的表,如信息表、业务明细、交易流水、映射关系表、维度表和参数代码类型表。同时,需要排除内部控制、业务流程控制表,以及中间的、临时的、备份的、冗余的、预留的数据,以及无活动的表。
规划的下游系统模型主题涵盖了金融行业的多个领域,包括监管报告、风险管理、对账、营销、客户关系管理、绩效考核等多个业务场景,表明数据仓库在银行业务中的核心地位,为各类业务决策提供数据支持。
这份演示文稿详细阐述了数据仓库贴源层的设计原则和上游系统调研的关键点,提供了选择合适入仓数据的框架,为构建高效、稳定的数据仓库体系提供了指导。
相关推荐








资源评论

蟹蛛
2025.06.07
该演示文件详细介绍了数据仓库的入仓表分析规则以及上游系统的现状调研。🍘

田仲政
2025.05.05
贴源层的上游调研和分析,为数据仓库的高效入仓奠定了基础。

章满莫
2025.03.29
对于从事数据仓库工作的专业人士来说,这是份不可多得的参考资料。

tot286969
- 粉丝: 0
最新资源
- 无忧上网导航系统技术解析与文件结构说明
- EasyWEB压缩包文件及其内容概述
- 无线局域网中802.11协议的CSMA/CA算法模拟实现
- ActionScript 3.0中文版权威教程助您入门与提升
- 读秀地址计算器工具解析与使用指南
- GML_AdaBoost工具箱0.3:高效人脸识别与目标检测工具
- 基于C++实现的十字路口智能交通灯控制系统
- Android应用开发详解源码合集(第一部分)
- RTSP协议深度解析:RTP/RTCP与SDP详解
- 基于C语言实现的多功能电子投票系统
- Android版本城际通覆盖文件及其核心组件解析
- 国际标准英语音标学习软件(口型训练与发音演示)
- 基于ASP与Flash的文件上传程序及源码分享
- 基于ASP.NET的多文件上传功能实现
- 功能强大的串口调试助手完美版
- MFC实现GIF图片显示的完整源代码下载
- .NET配置文件加密源代码详解与实现
- 基于C#开发的可运行学分管理软件(含数据库)
- 萨际通S302,L9语音王文件解析与内存卡资料说明
- 基于STC89C52单片机的超声波测距系统设计与实现
- ARM单片机学习指南:教材、教程与入门详解
- PHP100视频教程源代码合集1-69讲
- APUE示例源码(已编译)适用于/opt目录
- Professional DevExpress ASP.NET Controls 使用指南完整版