多层面数据建模与质量评估:从OWL到数据库完整性
立即解锁
发布时间: 2025-08-22 02:02:27 阅读量: 3 订阅数: 7 


概念建模与信息系统进展
### 多层面数据建模与质量评估:从OWL到数据库完整性
在当今的数据驱动世界中,准确评估和管理数据质量至关重要。本文将深入探讨多层面概念建模与OWL(Web本体语言)的应用,以及数据库中可能元组对数据完整性的影响。
#### 1. OWL中的多层面概念建模
在本体工程中,m - 对象/m - 关系方法与OWL的结合为数据建模提供了强大的工具。为了确保数据的完整性,我们需要引入一些完整性约束(IC)。
例如,对于“Car - producedBy - CarManufacturer”这种关系,有如下完整性约束:
```plaintext
IC:∃concretize t.{Car - producedBy - CarManufacturer}
⊑
(∀source.(∃concretize t.
{Car} ⊔{Car} )⊓∀target.∃concretize t.{CarManufacturer})⊔(∀source.∃concretize t.
{Car} ⊓∀target.(∃concretize t.{CarManufacturer} ⊔{CarManufacturer}))
```
连接级别(connection level)的概念类似于m - 对象的级别,它确保了在更高层次上沿着m - 关系进行安全导航。例如,在连接级别(Model, Enterprise)下,所有具体化“Car - producedBy - CarManufacturer”的m - 关系都必须具体化一个在该级别上具体化该关系的m - 关系。
为了强制实施唯一名称假设,我们断言每对m - 关系(笛卡尔积)都属于不等式谓词。例如:
```plaintext
Car - producedBy - CarManufacturer ̸≈Product - producedBy - Company
```
OWL推理器可以通过类表达式来导航m - 关系。例如,要查询可能生产“MyPorsche911CarreraS”的工业部门,我们可以查询以下类的成员:
```plaintext
(IndustrialSector ⊓∃target−.((∃concretize t.{Product - producedBy - Company}
⊔
{Product - producedBy - Company})
⊓
∃source.
(∃concretize t−.{MyPorsche911CarreraS} ⊔{MyPorsche911CarreraS} )))
```
#### 2. 信息系统质量保障
信息系统(IS)和概念建模(CM)领域中的质量保障是一个不断发展的研究领域。当前的研究涵盖了理论方面(如质量定义和质量模型)和实践/经验方面(如质量测量和改进的方法、工具开发)。
QoIS研讨会涵盖了与信息系统质量相关的所有领域,包括数据质量、信息质量、系统质量以及模型、方法、过程、知识和环境质量。其目的有两个:一是汇聚从事信息系统质量各方面研究的研究人员和行业开发者,交流研究思路和成果;二是向参加ER 2009的更广泛的概念建模研究社区推广信息系统和概念模型质量的研究。
#### 3. 数据库中可能元组对数据完整性的影响
在一些数据库中,使用所谓的可能元组(maybe tuples)来表达元组是否属于某个关系的不确定性。为了评估这种关系的质量,需要考虑这种不确定性。
当前的数据质量维度度量方法没有考虑可能元组带来的不确定性,因此需要进行调整。数据完整性是一个重要的质量维度,通常有两种基本方法来区分可能元组和确定元组:
- 使用一个作为可能指示符的属性(值为YES或NO)。
- 指定元组概率。
##### 3.1 相关工作
现有的数据完整性度量方法,如Scannapieco、Naumann和Motro等人的工作,没有考虑可能元组的不确定性。以Naumann的方法为例,数据完整性由数据覆盖度(data coverage)和数据密度(data density)两个指标组成。
- 数据覆盖度:对于单个关系R,覆盖度c(R)是该关系中所有元组与对应实体类型E的所有实际存在实体数量的比率,即$c(R) = \frac{|R|}{|E|}$。
- 数据密度:属性值的密度衡量该值相对于其最大潜在信息内容的信息含量。元组t的密度d(t)是其值密度的平均值,关系R的密度d(R)是其元组密度的平均值,即$d(R)
0
0
复制全文
相关推荐










