当前位置：首页 > 问答 > 正文

Redis连接池老是读不出来咋整，排查思路和解决办法分享

这个问题确实很让人头疼,感觉就像水管明明接上了，但就是放不出水，咱们别慌，一步步来查，从最简单的地方开始，就像查家里为啥停水一样，先看自己家水龙头，再去看楼道水闸，最后再怀疑是不是整个小区都停了。

第一步：先检查最基本的——代码写对了吗？

很多时候问题就出在咱们自己的代码细节上。

连接参数对不对？ 这是最基础的，再仔细核对一下你的连接配置：Redis服务器的IP地址写对了吗？端口号是默认的6379吗？如果你的Redis设置了密码（requirepass），连接时密码传对了没？有时候可能是测试环境、生产环境配置混了，导致连错了服务器或者密码错误。(来源：常见编程疏忽)
取完数据后，有没有正确归还连接？ 这是使用连接池最核心的规矩，连接池里的连接是有限的，你从池子里借走（borrow）一个连接去执行命令，用完之后一定要记得还回去（return），如果你借了不还，比如拿到连接后，代码出了异常，没有执行到归还的代码，那么这个连接就“泄漏”了，一直占着茅坑不拉屎，当所有连接都被借光且没还时，下一个请求再来借连接，自然就“读不出来”了，会一直等待直到超时。(来源：连接池核心机制)
检查资源关闭的代码。 确保你的代码在try-catch-finally块中，在finally块里进行连接的关闭和归还，这样即使中间执行命令出错了，也能保证连接会被还回池子里。

第二步：看看连接池本身的配置合理吗？

如果代码逻辑没问题,那可能是连接池的配置不太适合当前的使用场景。

Redis连接池老是读不出来咋整，排查思路和解决办法分享

连接池大小设对了吗？ 连接池不是越大越好，如果设置得太小，业务量一上来，并发请求过多，连接瞬间就被借光了，后面的请求就只能排队等着，表现就是响应变慢甚至超时，但如果设置得太大，Redis服务器可能需要维护大量空闲连接，消耗不必要的资源，你需要根据你业务的并发量来调整一个合适的数值。(来源：连接池配置优化)
超时时间设对了吗？ 连接池有几个关键的超时时间：
- 获取连接超时时间： 当池子里没有空闲连接时，新的请求会等待一段时间，如果这个时间设得太短，可能还没来得及等到有连接归还就超时报错了，可以适当调长一点看看。
- 连接空闲超时时间： 如果一个连接在池子里空闲太久，可能会被池子自动关闭以节省资源，如果设得太短，可能导致连接被频繁销毁和创建，反而增加开销。
- 连接最大存活时间： 即使连接一直在被使用，到了一定时间也强制淘汰，防止长时间使用的连接出现不可预知的问题，检查这些超时配置是否合理。(来源：连接池超时参数解析)

第三步：问题可能不在客户端，而在Redis服务器本身

如果代码和连接池配置都查过了,还是不行，那就要看看Redis服务器是不是“生病了”。

Redis服务器内存够用吗？ 执行info memory命令，看看used_memory是否接近或超过maxmemory，如果Redis内存满了，根据你的淘汰策略（maxmemory-policy），它可能无法写入新数据，或者响应变得极其缓慢，导致客户端连接超时。
Redis的CPU和网络负载高吗？ 通过top命令或监控工具看看Redis进程的CPU使用率，如果CPU一直很高，说明Redis本身已经非常繁忙，处理命令的速度跟不上，请求会在Redis内部排队，客户端感觉就是“卡住了”，同样，网络带宽被打满也会导致通信缓慢。
Redis连接数超限了吗？ 执行info clients命令，查看connected_clients，Redis有最大连接数限制（默认10000），如果连接数达到上限，新的客户端连接会被拒绝，虽然连接池会复用连接，但如果你的应用实例很多，每个实例的池子又比较大，总的连接数也可能触顶。(来源：Redis服务器状态检查)
Redis是否触发了持久化阻塞？ 如果Redis正在执行BGSAVE（生成RDB快照）或AOF重写，并且你的服务器是机械硬盘，那么磁盘IO可能会非常高，导致Redis在此期间处理所有命令都会变慢，感觉就像停滞了一样。

第四步：网络问题是个“隐形杀手”

Redis连接池老是读不出来咋整，排查思路和解决办法分享

客户端和Redis服务器之间的网络状况不稳定,也会导致时好时坏。

网络延迟和丢包。 可以用ping和traceroute（或tracert）命令测试一下从客户端到Redis服务器的网络延迟和路由情况，如果延迟很高或者有丢包，数据传输就会很慢且不可靠。
防火墙或安全组规则。 确认一下服务器之间的防火墙、云服务商的安全组规则，是否允许你的客户端IP地址和端口访问Redis，有时候规则变更可能会误伤。

总结一下排查顺序和建议的解决办法：