OLAP元数据交换系统与XML文档信息提取技术解析
立即解锁
发布时间: 2025-08-18 00:54:18 阅读量: 3 订阅数: 18 

### OLAP元数据交换系统与XML文档信息提取技术解析
#### 1. OLAP元数据交换模型概述
在线分析处理(OLAP)系统是数据仓库的关键技术之一,但约40种OLAP产品的元数据不同,导致数据交换和交互困难。为此,提出了基于XML的OLAP元数据交换模型,以解决这一问题。
#### 2. 基于XML的OLAP元数据交换模型设计
- **选择XML的原因**:XML具有供应商无关、编程语言无关的特点,其结构可通过DTD和XSD定义。该模型通过观察和提取多种产品的共同特征,并处理产品间的差异来设计。它包含多种产品共享的公共元数据和特定于产品的特殊元数据,特殊元数据可存储在元数据存储中,必要时使用。
- **模型的基本元素**:由DATABASE、CUBE、DIMENSION、MEASURE、HIERARCHY、LEVEL、MEMBER和ATTRIBUTE等基本元素组成。
- **DATABASE**:最高级结构,由PROPERTY、DATASOURCE和CUBE组成。
- **CUBE**:由PROPERTY、MEASURE和DIMENSION组成,可选元素STORE包含存储结构信息。PROPERTY元素包含立方体类型、描述等信息。
- **MEASURE**:DTD包含用于分析的实际数据的值和类型,数据类型通常为数字类型,具有numeric_precision、numeric_units和numeric_scale等属性。属性包括measure_aggregator、caption和unique_name等。
- **DIMENSION**:由HIERARCHY、DATATYPE和ATTRIBUTE元素组成。通常一个维度只有一个层次结构,但有些产品支持多个层次结构。许多产品不支持DATATYPE,有些产品在维度上支持ATTRIBUTE,而其他产品在级别或成员上支持。
- **HIERARCHY**:由LEVEL、ATTRIBUTE和DATATYPE元素组成,结构与维度相似。
以下是MEASURE、DIMENSION和HIERARCHY的DTD示例:
```xml
<!ELEMENT MEASURE(PROPERTY,FIELD+,DATATYPE)*>
<!ATTLIST MEASURE
measure_name CDATA #REQUIRED
created_on CDATA #IMPLIED
last_schema_update CDATA #IMPLIED
schema_updated_by CDATA #IMPLIED
>
<!ELEMENT PROPERTY(database_name+, cube_name, measure_unique_name?,
measure_caption?, measure_guid?, measure_desc*, measure_aggregator )>
<!ELEMENT DIMENSION(PROPERTY, HIERARCHY*,DATATYPE?,ATTRIBUTE*)>
<!ATTLIST DIMENSION
dimension_name CDATA #REQUIRED
created_on CDATA #IMPLIED
last_schema_update CDATA #IMPLIED
schema_updated_by CDATA #IMPLIED
>
<!ELEMENT PROPERTY(database_name+, cube_name*,
dimension_unique_name?,
dimension_desc*, dimension_ordinal, dimension_type,
dimension_cardinality,
default_hierarchy, is_virtual, is_drillthrough_enabled?,
dimension_unique_settings?, is_SQL_enabled? )>
<!ELEMENT HIERARCHY(PROPERTY, LEVEL*, DATATYPE?, ATTRIBUTE*)>
<!ATTLIST HIERARCHY
hierarchy_name CDATA #REQUIRED
created_on CDATA #IMPLIED
last_schema_update CDATA #IMPLIED
schema_updated_by CDATA #IMPLIED
>
```
#### 3. 模型应用方法
OLAP元数据交换系统通过从每个产品中提取元数据来处理产品的特殊特征。根据产品组织元数据的方式,需要以不同方式应用该模型。当为特定产品创建立方体时,需要进行转换以映射到产品的模型。
以下是几种OLAP产品模型的分析:
| 产品 | 存储 | 立方体 | 属性 | 维度 |
| --- | --- | --- | --- | --- |
| Cognos Powerplay | MOLAP | 超立方体 | 不支持 | 多级(特殊类别) |
| Hyperion Essbase | MOLAP | 超立方体 | 维度属性 | 单层次结构,多级 |
| Informix Metacube | ROLAP | 块,多立方体 | 支持 | 单层次结构,多级 |
| MS OLAP Services | HOLAP | 块,多立方体 | 级别属性 | 单层次结构,多级 |
| Oracle Express | MOLAP (HOLAP) | 系列,多立方体 | 不支持 | 多层次结构,单级 |
#### 4. 系
0
0
复制全文
相关推荐








