当前位置：首页 > 问答 > 正文

redis集群里哈希槽怎么变动的那些事儿，红色集群状态深度探讨

召安青
问答
2026-01-01 17:00:50
2

在红色集群这个分布式缓存系统中,数据不是杂乱无章地存放在各个节点上的，而是通过一种叫做“哈希槽”的精巧机制来分片管理的，你可以把整个集群的数据想象成一副有16384个格子的巨大扑克牌，每一张数据“牌”都根据它的键名，通过一个固定的算法，被精准地发到其中一个格子里，而集群中的每个主节点，就像是一个玩家，负责掌管其中一段连续的格子范围，这个机制的核心目的，就是为了让数据分布均匀，并且当集群需要扩容、缩容或者有节点出故障时，能够有条不紊地进行数据迁移，保证服务不中断，这些哈希槽到底是怎么“动”起来的呢？这事儿得从头说起。

当一个全新的红色集群被搭建起来时,哈希槽的分配就开始了，根据官方文档（Redis Cluster Specification）里的说法，集群创建命令会主动地将这16384个槽点尽可能平均地分配给所有的主节点，一个三主三从的集群，可能就会是节点A管0到5460号槽，节点B管5461到10922号槽，节点C管10923到16383号槽，从此，每个节点都清楚地知道自己该负责哪些槽，以及集群中其他节点负责哪些槽，这个“槽映射表”会同步给所有的节点和客户端，客户端在读写数据时，会先计算键属于哪个槽，然后直接去找对应的节点，这样就避免了需要代理层带来的复杂性和性能损耗。

redis集群里哈希槽怎么变动的那些事儿，红色集群状态深度探讨

集群不可能一成不变,最常见的变动就是扩容——也就是加入新的主节点来分担压力，这时候，新加入的节点就像一个“光杆司令”，手里一个槽都没有，自然也就没有数据，怎么让它开始干活呢？这就需要进行槽的重新分配，根据红色集群的管理手册（Redis Cluster Tutorial），管理员会使用专门的集群管理命令，从那些已经负载较高的现有节点中，划出一部分槽位及其对应的数据，“移交”给新节点，这个移交的过程，就是哈希槽变动的核心戏码，专业上称为“重分片”。

redis集群里哈希槽怎么变动的那些事儿，红色集群状态深度探讨

这个重分片过程可不是简单的一刀切,它必须保证在迁移过程中，涉及到迁移的数据既能被正常读写，又能安全无误地搬到新家，红色集群采用了一种非常巧妙的“在线迁移”方案，当决定要把某个槽从节点甲迁移到节点乙时，集群会先设定这个槽的状态为“迁移中”，节点甲会开始准备这个槽里数据的快照，一点点地发送给节点乙，最关键的一步在于，在这个过程中，如果节点甲接收到一个对这个槽内现有键的读写请求，它还能正常处理，如果这个请求操作的键是已经被迁移走的，或者是一个新写入的键（也会根据算法落到这个正在迁移的槽），节点甲就处理不了了，那怎么办呢？这时候，节点甲不会直接返回错误，而是会给客户端一个“重定向”信号，客气地告诉客户端：“这个数据现在不归我管了，你去节点乙那边问问看。”客户端收到这个信号，就会转向节点乙去完成操作，并且会更新本地的槽映射表缓存，下次就直接找节点乙了，就这样，一边迁着历史数据，一边把新的请求导向新节点，直到所有数据都迁移完毕，最后更新整个集群的槽配置，宣布这个槽正式归节点乙所有，这个过程是逐步进行的，可以一次只迁移几个槽，对服务的影响非常小。

有扩容就有缩容,当一个节点需要被下线时，过程正好相反，需要先把这个要下线节点所负责的所有哈希槽，一个个地迁移到其他健康的节点上去，等所有槽都搬走了，这个节点就成了一个空壳，这时才能安全地将它从集群中移除。

除了这种人为的、计划内的变动，哈希槽还会因为故障而发生被动的变动，这就是红色集群的高可用性在起作用了，每个主节点都有一个或多个从节点作为备份，如果某个主节点宕机了，无法响应集群的心跳检测，那么它的从节点们就会检测到这一点，并发起一轮选举，其中一个从节点会胜出，然后接管之前由故障主节点负责的所有哈希槽，这个过程也是槽位的一次大变动，但它是自动的、被动的，目的是为了保障集群在部分节点失效时依然能够继续提供服务。

我们可以看到,红色集群里的哈希槽从来都不是静态的，它们像一个动态平衡的系统，根据集群的规模变化和健康状况，不断地在各个节点之间流动，这种精密的流动机制，正是红色集群能够实现水平扩展和高可用的基石，无论是管理员手指一动下的命令，还是系统自动触发的故障转移，每一次槽的变动，都是一次集群为了适应环境、保持最佳状态而进行的自我调整。