数据备份与恢复的全面指南
立即解锁
发布时间: 2025-08-27 00:28:51 阅读量: 1 订阅数: 8 


系统与网络管理实践:从入门到精通
### 数据备份与恢复的全面指南
#### 1. 增量备份的深入理解
在数据备份领域,增量备份是一个重要概念。不同系统的增量备份有所不同,有些系统只有单级增量备份,而有些则能记录自上一次同级别备份以来所有更改的文件,这种被称为真正的增量备份或差异备份。
为了节省磁带资源,如果系统支持,可以采用两级增量备份。例如,每月第一天进行完整备份(0 级),之后每晚进行 1 级增量备份,捕获自初始完整备份以来修改的文件。到月中时,1 级增量备份的大小可能会变得过大。此时,在月中(15 号)开始进行 2 级增量备份,记录自上次 1 级备份以来更改的文件,这样月中的增量备份大小会再次变小。
不过,这种两级增量备份也有缺点:
- 跟踪各类备份变得更复杂,但如果系统完全自动化且有良好的库存管理,这不是问题。
- 恢复变得更困难且易出错,需要读取 0 级、1 级和 2 级磁带以确保所有文件都被恢复,这不仅耗时,手动操作时更容易出错。而且,若磁带损坏概率为 1:1000,依赖三个磁带而非两个会增加风险。
#### 2. 时间与容量规划
数据的恢复和备份受时间限制。恢复需在服务级别协议(SLA)规定的时间内完成,并且大多数系统在备份时会显著变慢,有些服务甚至在备份期间必须完全关闭。
备份速度受以下因素中最慢的那个限制:磁盘读取性能、备份介质写入性能、带宽以及磁盘与备份介质之间网络的延迟。恢复时间则受这些因素的反向影响,例如磁带设备写入磁带的速度通常比读取速度慢很多。
很多新的系统管理员会误以为供应商关于磁带驱动器速度和容量的说明与实际性能相关,实际上差异可能非常大,可达 1500%。供应商通常会不断优化备份算法以提高速度,但常常忽略恢复速度,因为大多数客户不会主动要求快速恢复,有此需求的客户则愿意额外付费。
##### 2.1 备份速度
备份过程中,最慢的环节决定备份速度,同时还受机械问题影响。大多数磁带驱动器在数据供应速度能跟上写入速度时(流式模式)以高速写入,但数据供应不足时会大幅降速。若驱动器无数据可写,会停止、倒带并等待足够数据后再开始写入,驱动器制造商称这种现象为“擦鞋效应”,这不仅降低磁带性能,还会对磁带介质造成过度压力。
如果服务器无法快速提供数据,备份速度会显著降低。例如,网络拥塞会使数据传输到磁带主机的速度变慢,导致备份明显变慢。在构建备份和恢复系统时,必须考虑各种互连的速度,确保最慢的环节不会影响时间目标的达成。常见做法是使用专用网络让文件服务器与备份主机通信,存储区域网络(SAN)流行的一个原因就是能将备份流量从主网络移走。
为缓解备份时的性能问题,常用磁盘驱动器作为缓冲区。以前,系统通过将数据从一台服务器复制到集中备份主机上的磁带单元进行备份,现在则常在备份主机上安装大量磁盘,服务器将数据备份到备份主机的磁盘上,通常每个服务器每个磁盘卷存储一个文件。备份主机随后可以全磁带速度写入已完成的备份文件。在许多配置中,所有服务器在夜间写入备份数据,备份主机白天将数据写入磁带,这种方式称为磁盘 - 磁盘 - 磁带(D2D2T),因为本地磁盘访问比网络访问更具确定性,所以效果更好。
以下是备份速度影响因素的表格:
|影响因素|说明|
| ---- | ---- |
|磁盘读取性能|决定从磁盘获取数据的速度|
|备份介质写入性能|影响数据写入磁带等备份介质的速度|
|带宽|限制数据在网络中的传输速度|
|网络延迟|影响数据传输的及时性|
下面是备份速度相关的流程图:
```mermaid
graph LR
A[服务器] -->|数据传输| B[网络]
B -->|数据传输| C[磁带主机]
C -->|写入| D[磁带]
style A fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
style B fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
style C fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
style D fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
```
##### 2.2 恢复速度
恢复速度同样受最慢环节限制,且还有其他额外因素。在磁带上查找单个文件可能和恢复整个磁盘一样耗时,系统首先要跳过磁带上的其他卷,然后读取特定卷以找到要恢复的文件。如果磁带机制无法快进或跳转到特定数据段,操作会非常缓慢。
恢复整个磁盘也极其缓慢,主要影响因素不是驱动器读取速度,而是文件系统写入速度。几乎所有文件系统的写入效率都远低于读取效率,重建文件系统时性能往往最差,尤其是带日志的文件系统。恢复磁盘驱动器的时间可能是备份时间的 5 到 15 倍,这让很多人意外。
若服务器能快速接收数据使磁带驱动器保持在流式模式,恢复速度可达最快。但如果磁带驱动器的数据缓冲区满了,驱动器会降低磁带速度甚至完全停止,倒带并重新提速会造成很大延迟。
要确定是否达到时间目标,唯一方法是进行测试,对测试备份和测试恢复进行计时可以验证设计。随着时间推移,经验会帮助判断哪些可行哪些不可行,但由于备份和恢复系统每隔几年就会重新设计,获取有用经验可能较难,此时可以参考友好的销售工程师或备份恢复系统顾问的经验。
#### 3. 高可用性数据库的备份
对于像数据库这样的应用,确保备份成功有特定要求。数据库管理自己的存储空间,并针对复杂数据表的特定访问方式进行优化。由于备份软件通常不了解数据库的布局和数据访问方法,数据库通
0
0
复制全文
相关推荐










