Zookeeper 集群最少需要 3 台机器。以下是详细解释:
🧠 核心原因:避免脑裂(Split-Brain)
Zookeeper 使用 ZAB 协议(Zookeeper Atomic Broadcast) 实现一致性,要求集群中必须有多数节点(Majority)存活才能正常工作。
- 3 台机器的集群:多数节点 =
2
(计算方式:n/2 + 1
,n 为节点数) - 2 台机器的集群:多数节点 =
2
(因为2/2 + 1 = 2
)
📖 举例说明:
假设一个 2 节点集群(Node A 和 Node B):
- 当网络正常时,所有请求需全部节点同意才能生效(因为多数=2)。
- 若网络断开,A 和 B 无法通信:
- A 认为 B 宕机,但自身无法达到多数(2/2=1 < 2),停止服务。
- B 同样认为 A 宕机,也停止服务。
✅ 结果:集群整体不可用,但避免了数据不一致(脑裂)。
而 3 节点集群(Node A、B、C):
- 正常时,多数节点=2,只需任意 2 个节点同意即可生效。
- 若网络断开(如 A 与其他节点失联):
- A 无法达到多数(1 < 2),停止服务。
- B 和 C 能互相通信(2 ≥ 2),继续服务。
✅ 结果:集群仍可用,且无数据不一致风险。
⚖️ 为什么不是 1 台?
- 单节点无容错能力,宕机即服务中断。
- 无法满足分布式一致性的选举机制。
💡 总结
集群规模 | 多数节点数 | 容忍故障数 | 是否可用 |
---|---|---|---|
1 台 | 1 | 0 | ❌ 无容错 |
2 台 | 2 | 0 | ❌ 故障即停服 |
3 台 | 2 | 1 | ✅ 高可用 |
✅ 最小集群需 3 台:在保证一致性的前提下,实现高可用(允许 1 台故障),同时避免脑裂风险。