当前位置：首页 > 问答 > 正文

Redis资源回收其实没那么简单，聊聊那些常被忽视的问题和新思路

钊智敏
问答
2026-01-11 07:31:44
3

说到Redis的资源回收，很多人第一反应可能就是设置个过期时间（TTL），或者内存满了用LRU算法淘汰一些旧数据，这听起来挺直接的，对吧？但实际情况要复杂得多，里头有不少坑，一不留神就可能引发线上问题,今天我们就来聊聊那些容易被忽略的细节和一些新的解决思路。

一个最经典的“坑”就是主动删除与惰性删除的结合使用可能带来的内存压力，Redis采用的策略是：当你设置一个键的过期时间后，它并不会被立刻删除，Redis主要依靠两种方式来清理过期键：一种是惰性删除，也就是当客户端尝试访问这个键时，Redis才会检查它是否过期，如果过期就删除并返回空；另一种是定期删除，Redis会每隔一段时间随机抽取一批设置了过期时间的键，检查并删除其中已过期的。（来源：Redis官方文档关于过期键的说明）问题就出在这里，如果系统中有大量键在同一时间点过期，比如你做了一次性的缓存预热，并且设置了相同的过期时间，那么定期删除可能无法及时清理掉所有键，而如果后续没有客户端去访问这些过期的“僵尸键”，它们就会一直占着内存不释放，直到下一次被定期扫描到或者有人访问，在极端情况下，这可能导致实际内存使用率已经很高了，但可回收的内存却迟迟得不到释放，最终可能意外触发内存上限（maxmemory）策略,影响仍在服务的键。

配置内存淘汰策略（maxmemory-policy）时也容易想当然，当内存达到上限后，Redis提供了几种策略让你选择，比如allkeys-lru（从所有键中淘汰最近最少使用的）或volatile-lru（只从设置了过期时间的键中淘汰），很多人会觉得用volatile-lru更安全，只淘汰有过期时间的缓存键，不会动那些没设过期时间的关键数据，但这个选择本身就有风险，如果你的业务中，大部分关键数据确实没设过期时间，而缓存数据又非常多，那么当内存不足时，淘汰范围就被限制在了缓存键这个“小池子”里，很可能这个池子里的键大部分都还很“年轻”，离过期还早，LRU算法在里面也很难找到真正该淘汰的对象，导致淘汰效率很低，反而可能因为内存迟迟无法释放，引发写入失败或更严重的问题，相比之下，allkeys-lru把全部数据纳入淘汰范围，选择面更广，有时反而能更有效地缓解内存压力,但这要求你对所有数据的重要性有清晰的认知。

第三个常被忽视的问题是，Redis的过期和淘汰行为是阻塞式的，无论是客户端访问触发的惰性删除，还是定期任务扫描，删除键这个动作本身是在主线程中执行的，这意味着，如果你有一个包含数百万个字段的大Hash键或者一个很长的ZSet（有序集合）设置了过期时间，当这个巨型键需要被删除时，Redis主线程会花费相当长的时间来逐个释放内存，在这段时间里，整个Redis实例是无法响应其他命令的，这就造成了明显的延迟毛刺（Latency Spike），这对于延迟敏感的应用来说简直是灾难，很多人只关注了键的数量,却忽略了单个键的体积过大带来的风险。

Redis资源回收其实没那么简单，聊聊那些常被忽视的问题和新思路

面对这些问题，除了常规的优化（比如分散过期时间、监控大键）,有没有一些新的思路呢？

一种思路是更积极地利用Redis 4.0引入的LFU（最不经常使用）淘汰策略，相比于LRU只关注“最近何时使用”，LFU会统计键的访问频率，对于那些曾经很热门但现在已经“凉了”的缓存数据，LFU能更精准地识别并优先淘汰它们，而LRU可能会因为某个冷数据被偶然访问了一次而把它保护起来，在缓存场景下，LFU往往能带来更高的缓存命中率。（来源：Redis作者Salvatore Sanfilippo关于LFU的博客介绍）

另一个重要的新思路是依赖Redis的异步删除特性（从Redis 4.0版本开始逐步完善），对于一些可能导致阻塞的大键删除操作，你可以使用UNLINK命令来代替传统的DEL命令。UNLINK会先将键从 keyspace 中移除，真正的内存释放操作会交给后台线程异步处理，从而避免了阻塞主线程，同样，在配置文件中，你可以设置lazyfree-lazy-eviction、lazyfree-lazy-expire等选项，让Redis在因为内存不足淘汰键或定期删除过期键时，也采用这种异步的方式，这能极大地平滑因删除操作引起的延迟波动。（来源：Redis 4.0 release notes）

一个根本性的思路是转变视角：不要总想着怎么“回收”，而是要想想怎么“不产生”那么多垃圾，这意味着需要更精细化的缓存管理和数据设计，是否所有数据都适合放进Redis？那些体积巨大、访问不频繁的数据，是不是放在数据库里更合适？是否可以采用更高效的序列化方式减少内存占用？是否可以建立更科学的缓存更新和失效机制，避免大量缓存同时失效？这些看似基础的设计,往往比出了问题再想办法回收更能从根本上解决问题。

Redis的资源回收绝不是设个TTL和maxmemory-policy就高枕无忧了，它需要你深入了解其底层机制，结合自己业务的读写模式和数据结构特点，进行细致的监控、策略选择和架构设计,才能确保服务既高效又稳定。

Redis资源回收其实没那么简单，聊聊那些常被忽视的问题和新思路