BI Question List.doc
需积分: 0 103 浏览量
更新于2013-04-22
收藏 375KB DOC 举报
BI(Business Intelligence)是企业用来收集、分析和呈现数据以支持决策制定的一种技术。这份问题列表涉及了BI的重要组成部分——数据仓库(DWH)的概念、方法论和ETL(提取、转换、加载)过程,主要使用了Informatica作为ETL工具。以下是详细的知识点解析:
A. 数据仓库概念和方法论
1. 数据仓库特性:数据仓库是一个集中的、面向主题的、反映历史变化的数据存储,旨在支持管理决策。
2. OLTP(在线事务处理)与OLAP(在线分析处理):OLTP是日常业务操作,处理大量事务;OLAP用于分析查询,支持复杂的多维分析。
3. 数据仓库架构:通常包括源系统、数据 staging 区、ODS(操作数据存储)、数据仓库和数据集市。
4. 数据仓库构建生命周期:包括需求分析、设计、开发、测试、部署和维护等阶段。
5. 数据建模:在DWH项目中,涉及星型、雪花型等维度建模,以及关系型和多维数据模型的选择。
B. 维度建模和事实表
6. 关系型数据建模与维度数据建模:前者侧重于事务处理,后者关注分析查询。
7. 晚到的维度和事实:处理在加载后才出现的新维度或事实数据。
8. 数据仓库与数据集市:数据仓库是整个企业的数据存储,而数据集市是特定部门或业务领域的数据仓库。
9. 元数据:描述数据的数据,包括数据来源、含义等,通过元数据管理系统进行管理。
10. ODS(操作数据存储):介于源系统和数据仓库之间,用于数据清洗和预处理。
11. ODS与staging区:ODS包含业务规则,staging区主要是数据的临时存储。
12. 事实表与维度表:事实表包含测量数据,维度表提供上下文信息。
13. 维度类型:时间、地理、产品、客户等;SCD(Slowly Changing Dimension)处理维度的变化。
14. 事实类型:累积事实、时期事实、交易事实等。
15. 事实表格类型:累积、时期、稀疏、稠密等。
16. 数据仓库模式:星型、雪花型、星座型等。
17. 替代键(Surrogate Key):无业务意义的唯一标识符,用于处理维度变化。
18. 粒度/Grain:数据仓库中最小的分析单位。
19. RDBMS与MDDB(多维数据库):RDBMS适合事务处理,MDDB适合OLAP分析,MDDB在处理多维数据上有优势。
20. 钻取(Drill down)与上卷(Drill up):向下深入细节,向上概括汇总。
21. 旋转(Rotation):多维数据的不同视角转换。
22. 切片(Slicing)与切块(Dicing):在特定维度上选择数据子集。
23. OLAP类型/模型:ROLAP、MOLAP、HOLAP。
24. 数据模型优化技术:索引、分区、压缩等。
25. 审计模型元素:数据更改跟踪、用户活动监控等。
C. ETL(Informatica)
26. ETL:从不同源头抽取数据,转换为适合分析格式,加载到目标系统的过程。
27. ETL工具:Informatica、Talend、SSIS等。
28. 维度表和事实表加载:维度表通常是预先加载,事实表随事务更新。
29. 全量加载与增量加载:全量重新加载所有数据,增量只加载新或已变更数据。
30. Informatica Power Center客户端组件:Designer、Workflow Manager、Repository Manager等。
31. 目标定义创建方法:直接创建、从源映射等。
32. 常见Informatica转换:源解析器、目标编写器、查找、连接、聚合等。
33. 主动与被动转换:主动转换改变数据流,被动转换不影响数据流。
34. 连接与非连接转换:连接转换实时处理,非连接转换单独执行。
35. 连接查找与非连接查找:连接查找在线处理,非连接查找离线缓存结果。
36. 动态缓存查找何时使用:当数据变化不大时,提高性能。
37. 缓存与未缓存查找:缓存提高速度,未缓存可能更实时。
38. 查找缓存类型:内存、文件、数据库等。
39. 路由器与过滤器转换:路由器分发数据流,过滤器按条件剔除数据。
40. 空值行过滤:通过过滤器或源限定器实现。
41. 参数与变量:参数是预定义值,变量可动态改变。
42. 单美元符与双美元符:$用于表达式,$$用于变量引用。
43. 映射运行:指执行映射的过程,包括调度和执行作业。
以上就是 BI Question List.doc 文件中涵盖的主要知识点,这些内容涵盖了数据仓库的设计、构建和ETL过程中涉及的关键技术和概念。理解并掌握这些知识,对于从事BI工作的专业人士来说至关重要。

王景远
- 粉丝: 32
最新资源
- (源码)基于C语言的电子项目集.zip
- (源码)基于 C++ 编程语言的激光表演嵌入式系统.zip
- (源码)基于Go语言Singo框架的G站项目.zip
- 编程面试高频算法题详解与系统设计
- 【Multisim14 LM324差分组成减法电路】2024-7-3
- (源码)基于C++的轻量级查询引擎.zip
- (源码)基于Python的InternLM2Chat7B(4bit量化)本地搭建项目.zip
- 【软件开发工具】IntelliJ IDEA开发配置指南
- 无线传感器网络在尾矿安全监控中的应用.docx
- 成本会计课程基于网络考核改革试点方案.doc
- (源码)基于Arduino编程语言的蜂后管理控制系统 ardBeeQueen.zip
- 单片机的频率计研究与设计开发40;研究与设计开发41;.doc
- 项目管理-班组安全会一定要有针对性.docx
- c51单片机控制红外通信接口电路图的方案设计书.doc
- 图书馆管理系统C++代码.doc
- 系统集成施工方案.doc