缓存淘汰算法-LRU

yangyanping20108

已于 2023-09-08 17:26:43 修改

阅读量371

点赞数

CC 4.0 BY-SA版权

分类专栏： redis 文章标签：算法

于 2023-09-07 20:29:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yangyanping20108/article/details/132745300

redis 专栏收录该内容

18 篇文章

订阅专栏

目录

一、LRU 算法

二、LRU 算法图解

三、LRU 算法实现

四、LRU 算法分析

五、LRU 算法改进方案

前言

我们常用缓存来提升数据查询速度，由于缓存容量有限，当缓存容量到达上限，就需要删除部分数据挪出空间，这样新数据才可以添加进来。缓存数据不能随机删除，一般情况下我们需要根据某种算法删除缓存数据。常用淘汰算法有 LRU,LFU,FIFO,这篇文章我们聊聊 LRU 算法。

一、LRU 算法

LRU（Least recently used，最近最少使用）算法根据数据的历史访问记录来进行淘汰数据，其核心思想是“如果数据最近被访问过，那么将来被访问的几率也更高”。

最常见的实现是使用一个链表保存缓存数据，详细算法实现如下：

1. 新数据插入到链表头部；

2. 每当缓存命中（即缓存数据被访问），则将数据移到链表头部；

3. 当链表满的时候，将链表尾部的数据丢弃。

二、LRU 算法图解

1.初始化一个大小为 n 的列表

2.访问一个数据且该数据存在于缓存空间中，返回该数据对应值并将该节点移动到列表头节点，其余节点位置不变。比如访问 key=C

3.插入一个 key=G 节点，直接将数据添加到头结点

4. 假设列表已满，这时再插入一个 key=H 节点，则先删除F节点，在将H节点添加到头结点

这里总结一下 LRU 算法的具体步骤：

新数据直接插入到列表头部
缓存数据被命中，将数据移动到列表头部
缓存已满的时候，移除列表尾部数据。

三、LRU 算法实现

上面例子中可以看到，LRU 算法需要添加头节点，删除尾结点。而链表添加节点/删除节点时间复杂度 O(1)，非常适合当做存储缓存数据容器。但是不能使用普通的单向链表，单向链表有几点劣势:

每次获取任意节点数据，都需要从头节点遍历下去，这就导致获取节点复杂度为 O(N)。
移动中间节点到头结点，我们需要知道中间节点前一个节点的信息，单向链表就不得不再次遍历获取信息。

针对以上问题，可以结合其他数据结构解决。

使用散列表存储节点，获取节点的复杂度将会降低为 O(1)。节点移动问题可以在节点中再增加前驱指针，记录上一个节点信息，这样链表就从单向链表变成了双向链表。

综上使用双向链表加散列表结合体，数据结构如图所示:

在双向链表中特意增加两个『哨兵』节点，不用来存储任何数据。使用哨兵节点，增加/删除节点的时候就可以不用考虑边界节点不存在的情况，简化编程难度，降低代码复杂度。

四、LRU 算法分析

缓存命中率是缓存系统的非常重要指标，如果缓存系统的缓存命中率过低，将会导致查询回流到数据库，导致数据库的压力升高。

结合以上分析 LRU 算法优缺点。

LRU 算法优势在于算法实现难度不大，对于热点数据， LRU 效率会很好。

LRU 算法劣势在于对于偶发的批量操作，比如说批量查询历史数据，就有可能使缓存中热门数据被这些历史数据替换，造成缓存污染，导致缓存命中率下降，减慢了正常数据查询。

五、LRU 算法改进方案

以下方案来源于 MySQL InnoDB LRU 改进算法

将链表拆分成两部分，分为热数据区，与冷数据区，如图所示。

改进之后算法流程将会变成下面的一样:

访问数据如果位于热数据区，与之前 LRU 算法一样，移动到热数据区的头结点。
插入数据时，若缓存已满，淘汰尾结点的数据。然后将数据插入冷数据区的头结点。
处于冷数据区的数据每次被访问需要做如下判断：
若该数据已在缓存中超过指定时间，比如说 1 s，则移动到热数据区的头结点。
若该数据存在在时间小于指定的时间，则位置保持不变。

对于偶发的批量查询，数据仅仅只会落入冷数据区，然后很快就会被淘汰出去。热门数据区的数据将不会受到影响，这样就解决了 LRU 算法缓存命中率下降的问题。

六、Redis LRU 算法

redis中每一个value都可以理解为是一个RedisObject，结构体RedisObject定义了5个属性：type、enconding、lru、refcount和*prt，如下图

Redis对每个KV对中的V，会使用个redisObject结构体保存指向V的指针。那redisObject除记录值的指针，还会使用24 bits保存LRU时钟信息，对应的是lru成员变量。这样，每个KV对都会把它最近一次被访问的时间戳，记录在lru变量。

Redis 在每个数据对象 RedisObject 中存放 lru 字段，表示该数据最近一次访问的时间戳，以后做数据淘汰时用该字段作为比较依据。

当执行数据淘汰时，首次执行将按以下步骤选择数据：

1、随机选出 N （maxmemory-samples）个数据，把它们作为一个候选集合；

2、比较这 N 个数据的 lru 字段，把 lru 字段值最小的数据淘汰出去；

以后再次进行数据淘汰时，将以第一次淘汰时创建的候选集合中最小的 lru 值 minLruInSet 为基准，挑选 lru 字段值小于 minLruInSet 的数据并放入到集合中，当候选数据集中的数据个数再次达到 maxmemory-samples 时，Redis 就把候选集合中 lru 字段值最小的数据淘汰出去。

通过维护这个 lru 小值集合可以减小发生数据淘汰时对 redis 产生的性能影响，因为它不需要使用链表来保存所有的数据，也不存在数据的移动。

官网表明在样本数 maxmemory-samples = 10 的情况下，Redis3.0 很接近真正的 LRU 实现。

yangyanping20108

博客等级

码龄14年

136
原创

122
点赞

425
收藏

76
粉丝

关注

私信

热门文章

分类专栏

java基础和并发编程 26篇
MySQL 15篇
servlet 和 mvc 3篇
分布式 42篇
大数据 5篇
redis 18篇
消息队列 12篇
spring 10篇
搜索 10篇

展开全部收起

上一篇：: TiDB介绍

下一篇：: tomcat配置优化

最新评论

优化mysql分页查询
谈笑9527: id不是自增时怎么改造sql呢？
QLExpress规则引擎实战
小小小巫女: 你本意是从绑定容器的实例方法，但是用的是addFunctionOfClassMethod方法，因为你方法名和映射名正好一样，所以执行的时候恰巧找到类这个方法所以没报错，而且你那个类如果有注入其他的，拿不到的是null; 本意是绑定容器实例的话，你的用Service那个方法。
QLExpress规则引擎实战
小小小巫女: 你这虽然没报错，但并没有真正使用到函数定义的功能吧，只是直接匹配到的bean的方法。
多机房部署：跨地域的分布式系统如何做？
气自华: 异城双活每个机房都有主从库，应用层读写操作都是访问自己机房的数据库，两边数据肯定会有差异，会会使用双向同步。如果只是单纯同步数据还好，如果是都在修改同一条记录，那显然需要引入其他的解决方案了。
QLExpress规则引擎实战
qq_34734467: 你用注解注入就行了，他这边贴的代码可能是通过xml方式注入的

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。