数据库规范化:从基础到实践
立即解锁
发布时间: 2025-08-23 00:50:35 阅读量: 3 订阅数: 17 

### 数据库规范化:从基础到实践
#### 1. 函数依赖与主键识别
函数依赖是数据库设计中的重要概念,它描述了属性之间的关系。通过分析函数依赖,我们可以确定关系的主键,进而为数据库的规范化奠定基础。
##### 1.1 函数依赖示例
在一个示例关系中,存在以下函数依赖:
- \(A \to C\) (fd1)
- \(C \to A\) (fd2)
- \(B \to D\) (fd3)
- \(A, B \to E\) (fd4)
- \(B, C \to E\) (fd5)
这些函数依赖表明了属性之间的依赖关系,例如 \(A\) 可以决定 \(C\),\(B\) 可以决定 \(D\) 等。
##### 1.2 主键识别示例
通过函数依赖来确定主键是一个关键步骤。以下是两个示例:
- **StaffBranch 关系**:该关系有五个函数依赖,其决定因素包括 `staffNo`、`branchNo`、`bAddress`、`(branchNo, position)` 和 `(bAddress, position)`。经过分析,唯一的候选键(即主键)是 `staffNo`,因为其他所有属性都依赖于它。
- **Sample 关系**:该关系有五个函数依赖,决定因素包括 \(A\)、\(B\)、\(C\)、\((A, B)\) 和 \((B, C)\)。能决定所有其他属性的决定因素是 \((A, B)\) 和 \((B, C)\),因此这两个都是候选键。由于它们的特性相似,主键的选择是任意的,未被选为主键的候选键称为备用键。
| 关系 | 候选键 | 主键 |
| ---- | ---- | ---- |
| StaffBranch | staffNo | staffNo |
| Sample | (A, B), (B, C) | 任意选择 (A, B) 或 (B, C) |
#### 2. 规范化过程概述
规范化是一种基于主键和函数依赖来分析关系的正式技术。它通过一系列规则来测试单个关系,将数据库规范化到不同程度。
##### 2.1 常见的范式
常见的范式包括第一范式(1NF)、第二范式(2NF)、第三范式(3NF),以及后来提出的 Boyce–Codd 范式(BCNF)、第四范式(4NF)和第五范式(5NF)。其中,除了 1NF,其他范式都基于属性之间的函数依赖。
```mermaid
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(未规范化形式 UNF):::process --> B(第一范式 1NF):::process
B --> C(第二范式 2NF):::process
C --> D(第三范式 3NF):::process
D --> E(BCNF):::process
E --> F(4NF):::process
F --> G(5NF):::process
```
##### 2.2 规范化的重要性
规范化可以减少数据冗余,避免更新异常。随着规范化的进行,关系的格式变得更加严格,对更新异常的抵抗力也更强。虽然只有 1NF 对于创建关系是关键的,但为了避免更新异常,通常建议至少将数据库规范化到 3NF。
#### 3. 第一范式(1NF)
第一范式是规范化的起点,它要求关系中每个行和列的交叉点只包含一个值。
##### 3.1 未规范化形式(UNF)
未规范化形式是指包含一个或多个重复组的表格。要将未规范化表格转换为 1NF,需要识别并移除重复组。
##### 3.2 移除重复组的方法
有两种常见的方法可以移除未规范化表格中的重复组:
- **方法一:填充空列**:通过在包含重复数据的行的空列中输入适当的数据,即复制非重复数据来填充空白。这种方法通常被称为“扁平化”表格,但会引入更多的数据冗余。
- **方法二:创建新关系**:将重复数据与原始键属性的副本一起放在一个单独的关系中。如果未规范化表格包含多个重复组或嵌套的重复组,则需要多次应用此方法,直到没有重复组为止。这种方法产生的冗余较少,能使表格在规范化过程中更进一步。
##### 3.3 示例:DreamHome 租赁数据
以 DreamHome 的
0
0
复制全文
相关推荐










