Redis集群

一、为什么要搭建集群

通常,为了提高网站响应速度,总是把热点数据保存在内存中而不是直接从后端数据库中读取。

Redis是一个很好的Cache工具。大型网站应用,热点数据量往往巨大,几十G上百G是很正常的事儿。

由于内存大小的限制,使用一台 Redis 实例显然无法满足需求,这时就需要使用多台 Redis作为缓存数据库。但是如何保证数据存储的一致性呢,这时就需要搭建redis集群.采用合理的机制,保证用户的正常的访问需求。

采用redis集群,可以保证数据分散存储,同时保证数据存储的一致性,并且在内部实现高可用的机制,实现了服务故障的自动迁移。

二、windows下模拟redis集群

注意:

  • redis只有3.0之后的版本才有集群
  • redis5.0以后搭建集群不需要再使用集群管理工具redis-trib,redis-cli实现了集群管理工具。

本次集群模拟基于redis 4.0.14,下载地址:https://github.com/tporadowski/redis/releases/tag/v4.0.14

新建一个redisCluster目录,存放redis各个节点。

配置redis

修改redis.windows.conf,修改内容为:

port 7001//修改为与当前文件夹名字一样的端口号
appendonly yes //指定是否在每次更新操作后进行日志记录,Redis在默认情况下是异步的把数据写入磁盘,如果不开启,可能会在断电时导致一段时间内的数据丢失。 yes表示:存储方式,aof,将写操作记录保存到日志中
cluster-enabled yes //开启集群模式
cluster-config-file nodes-7001.conf  //保存节点配置,自动创建,自动更新(建议命名时加上端口号)
cluster-node-timeout 15000 //集群超时时间,节点超过这个时间没反应就断定是宕机

然后把7001 redis文件,每样复制一份到7002 7003 7004 7005 7006!(Redis集群至少需要3个master节点,所以现在总共有6个节点,就只能是1master对应1slave这种方式)。

然后打开7001 --- 7006 的redis.windows.conf文件,把端口和cluster-config-file配置项改一下。

然后每个节点文件下建立一个启动bat文件,startredis.bat:

title redis
redis-server.exe redis.windows.conf

然后每个点击启动即可。

安装Ruby语言运行环境 

Ruby语言运行环境 ,下载地址:http://dl.bintray.com/oneclick/rubyinstaller/rubyinstaller-2.3.3-x64.exe

选中3个,然后点击安装。

验证:打开cmd窗口,输入ruby –version出现版本号 表示安装成功。

下载安装Redis的Ruby驱动redis-xx.gem

下载地址:https://rubygems.org/pages/download

也可以去这里下载:https://www.jb51.net/softs/539242.html

解压后,在cmd命令行模式下进入rubygems-2.7.7目录执行:ruby setup.rb

接着,切换到redis集群目录下,执行gem install redis:

安装集群脚本redis-trib

下载地址  https://raw.githubusercontent.com/antirez/redis/unstable/src/redis-trib.rb

下载后放到redis集群文件根目录下:

启动集群

① 启动7001 -- 7006 所有的redis ( 或者启动所有集群节点start.bat ) 这里无论什么方式 只要启动redis了就可以。

② 开始创建集群 打开cmd 执行构建集群脚本 redis-trib.rb

ruby redis-trib.rb create --replicas 1 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7006

如果出现Node is not empty,先清空所有端口目录下面的nodes.conf和dump.rdb文件再执行上面的命令。

在出现 Can I set the above configuration? (type 'yes' to accept):   请确定并输入 yes 。

replicas 1中的1表示占比,表示主和从的比例数据,这里是三主三从,所以是1。

测试

在7001 库添加一个数据测试,然后其他库进行查询 数据同步过来就说明成功。

分配策略

采用一种叫做哈希槽 (hash slot)的方式来分配数据,redis cluster 默认分配了 16384 个slot,三个节点分别承担的slot 区间是:

三、常见的Redis集群方案

基于客户端分片

Redis Sharding是Redis Cluster出来之前,业界普遍使用的多Redis实例集群方法。其主要思想是基于哈希算法,根据Redis数据的key的哈希值对数据进行分片,将数据映射到各自节点上。

优点在于实现简单,缺点在于当Redis集群调整,每个客户端都需要更新调整。

基于代理服务器分片

客户端发送请求到独立部署代理组件,代理组件解析客户端的数据,并将请求转发至正确的节点,最后将结果回复给客户端。

优点在于透明接入,容易集群扩展,缺点在于多了一层代理转发,性能有所损耗。

Redis Sentinel(哨兵)

Redis Sentinel是官方从Redis 2.6版本提供的高可用方案,在Redis主从复制集群的基础上,增加Sentinel集群监控整个Redis集群。当Redis集群master节点发生故障时,Sentinel进行故障切换,选举出新的master,同时Sentinel本身支持高可用集群部署。

优点在于支持集群高可用,高性能读写,缺点在于没有实现数据分片,每个节点需要承载完整数据集,负载能力受当个Redis服务器限制,仅支持通过增加机器内存实现垂直扩容,不支持水平扩展。

四、Redis Cluster原理

架构设计

Redis Cluster 是 在 3.0 版本正式推出的高可用集群方案,相比Redis Sentinel,Redis Cluster方案不需要额外部署Sentinel集群,而是通过集群内部通信实现集群监控,故障时主从切换;同时,支持内部基于哈希实现数据分片,支持动态水平扩容。

整体架构如下:

集群中有多个主节点,每个主节点有多个从节点,主从节点间数据一致,最少需要3个主节点,每个主节点最少需要1个从节点。

  • 高可用:当master节点故障时,自动主从切换
  • 高性能:主节点提供读写服务,从节点只读服务,提高系统吞吐量
  • 可扩展性:集群的数据分片存储,主节点间数据各不同,各自维护对应数据,可以为集群添加节点进行扩容,也可以下线部分节点进行水平缩容

数据分片

将整个数据集按照一定规则分配到多个节点上,称为数据分片,Redis Cluster采用的分片方案是哈希分片。

基本原理如下:Redis Cluster首先定义了编号0 ~ 16383的区间,称为槽,所有的键根据哈希函数映射到0 ~ 16383整数槽内,计算公式:slot=CRC16(key)&16383。每一个节点负责维护一部分槽以及槽所映射的键值数据。

槽是 Redis 集群管理数据的基本单位,集群扩容收缩就是槽和数据在节点之间的移动。

槽与节点映射关系如下:

  • 每个集群节点维护着一个16384 bit (2kB)的位数组,每个bit对应相同编号的槽,用 0 / 1标识对于某个槽自己是否拥有
  • 集群节点同时还维护着槽到集群节点的映射,是由长度为16384,数组下标代表槽编号,值为节点信息的数组

集群扩容

Redis Cluster支持不影响集群对外服务的情况下,对集群进行动态扩容或缩容,当Redis 新节点加入现有集群后,需要为其迁移槽和数据,确保迁移后每个节点负责相似数量的槽,使数据分布均匀在各节点上

整个数据迁移涉及系列操作,Redis提供了集群管理工具,包括基于Ruby的redis-trib.rb,还Redis5新提供的基于C语言redis-cli,下面的介绍以redis-cli为例:

源节点将指定slot数据迁移到目标节点,基本流程如下:

  • (1) redis-cli设置目标节点指定slot状态importing,让目标节点准备迁入slot数据
  • (2) redis-cli设置源节点指定slot状态migrating,让让源节点准备迁出slot的数据
  • (3) redis-cli批量迁移源节点指定slot中的数据到目标节点
  • (4) 数据迁移完后 redis-cli向集群所有主节点通知槽被分配给目标节点,主节点更新slot与节点映射关系信息

通常情况下,如果客户端请求的数据不在节点上,节点会回复 MOVED 重定向信息,客户端根据该信息再请求正确的节点。对于正在迁移的slot数据,保证客户端仍然能正常访问的设计如下:

  • (1) 迁移完成后才更新slot与节点映射关系信息,如果迁移进行中的映射信息保持与迁移前一致
  • (2) 如果客户端访问源节点,访问的key尚未迁出,则正常的处理该key
  • (3) 如果客户端访问源节点,访问的key尚已迁出,源节点返回ASK重定向信息
  • (4) 客户端根据ASK 重定向异常提取出目标节点信息,先向目标节点发送ASKING命令请求操作,再执行键命令

ASK 和 MOVED 这2个重定向控制有如下区别:

  • ASK 重定向说明集群正在进行 slot 数据迁移,客户端无法知道什么时候迁移完成,因此只能是临时性的重定向,客户端不会更新 slot 到 Redis 节点的映射缓存。
  • MOVED 重定向说明键对应的slot 已经明确指定到新的节点,因此需要更新 slot 到 Redis 节点的映射缓存

CAP取舍

CAP包括:一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance),系统如果不能在时限内达成数据一致性,就意味着发生了分区的情况,必须在C和A之间做出选择。

Redis Cluster选择了AP架构,为了保证可用性,Redis并不保证强一致性,在特定条件下会出现数据不一致甚至丢失写操作。

第一个原因是:为了在性能和一致性上做出权衡,主从节点间数据同步是异步复制的,当客户端成功写入master节点,master返回成功,master节点才将写操作异步复制给slave节点。

另外一个原因是,当集群发送网络分区,集群可能会分为两部分:多数派和少数派,假如masterA节点位于少数派,如果网络分区发生时间较短,那么集群将会继续正常运作;如果分区的时间足够长,让多数派中选举为新的master替代matsterA,那么分区期间写入masterA的数据就丢失了。

在网络分区期间, 客户端可以向matsterA发送写命令的最大时间是有限制的, 这一时间限制称为节点超时时间(cluster-node-timeout),是 Redis集群的一个重要的配置选项。

五、参考

https://segmentfault.com/a/1190000020747511

https://segmentfault.com/a/1190000021940951

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

codedot

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值