Zookeeper（分布式RPC调用和分布式文件储存）-CSDN博客

Znode 的特性：
- 路径唯一标识：每个 Znode 通过唯一路径（如 /app/config）访问。
- 数据存储：每个 Znode 可存储最多 1MB 的数据（通常用于存储状态或配置信息）。
- 版本控制：每个 Znode 包含版本号（version），用于实现乐观并发控制。
- 访问控制列表（ACL）：定义客户端对 Znode 的读写权限。
Znode 的类型：
- 持久节点（PERSISTENT）：创建后一直存在，除非显式删除。
- 临时节点（EPHEMERAL）：与客户端会话绑定，会话结束后自动删除。
- 持久顺序节点（PERSISTENT_SEQUENTIAL）：持久节点基础上，名称自动附加唯一递增编号。
- 临时顺序节点（EPHEMERAL_SEQUENTIAL）：临时节点基础上，名称自动附加唯一递增编号。
- 容器节点（Container Nodes）：子节点全部删除后自动删除自身（3.5.3 版本新增）。
- TTL 节点（Time-To-Live Nodes）：带生存时间的临时节点，超时未交互则自动删除（需配置支持）。

Zookeeper 通过内存存储与磁盘持久化结合，确保数据的高效访问与可靠性。

内存存储：
- DataTree：内存中维护完整的树形结构，包含所有 Znode 路径、数据及 ACL 信息。
- DataNode：数据存储的最小单元，记录节点数据、ACL、状态及父子节点引用。
- 高性能保障：内存存储支持快速读写，满足分布式系统低延迟需求。
持久化存储：
- 事务日志（Transaction Log）：
  - 记录所有写操作（如节点创建、数据更新），用于崩溃恢复。
  - 采用磁盘空间预分配策略，避免频繁扩容影响性能。
  - 日志文件按 64MB 大小预分配，写入时先序列化事务头和事务体，再生成校验和（Checksum）确保完整性。
- 数据快照（Snapshot）：
  - 定期将内存数据全量保存到磁盘，生成快照文件。
  - 快照过程异步执行，避免影响主流程，采用过半随机策略避免集群节点同时快照。
  - 快照文件包含内存数据库的全量数据及会话信息。
恢复机制：
- 启动时，Zookeeper 通过事务日志和快照文件恢复内存数据库。
- 若检测到非 Leader 节点的事务 ID 非法（比 Leader 大），则执行日志截断（TRUNC）以保持数据一致。

二、监听通知机制

Zookeeper 的监听通知机制是其核心功能之一，通过 Watcher（监听器） 实现客户端对服务端数据或状态的实时感知。这一机制在分布式 RPC 调用和分布式文件存储场景中至关重要，能够高效协调集群行为、实现动态配置更新和服务发现。以下是详细解析：

定义：
- Watcher 是 Zookeeper 提供的一种事件监听与通知机制，允许客户端注册对特定 Znode 或事件的关注，当服务端数据或状态变化时，主动通知客户端。
特点：
- 一次性触发：每个 Watcher 仅触发一次通知，客户端需重新注册以持续监听。
- 轻量级：通知仅包含事件类型和路径，不传递完整数据，减少网络开销。
- 异步传递：通知通过 TCP 连接异步发送，不阻塞客户端操作。
- 服务端无状态：服务端不存储 Watcher 列表，依赖客户端会话（Session）维护监听关系。

Watcher 可监听两类事件：节点事件和子节点事件，具体触发条件如下：

事件类型	触发条件	典型应用场景
NodeCreated	监听的 Znode 被创建（仅对持久节点有效，临时节点需结合其他事件使用）	服务注册、动态配置初始化
NodeDeleted	监听的 Znode 被删除	服务下线、临时节点失效通知
NodeDataChanged	监听的 Znode 数据内容被修改	配置更新、状态同步
NodeChildrenChanged	监听的 Znode 的子节点列表发生变化（新增或删除子节点）	服务发现、集群节点动态管理