当前位置：首页 > 问答 > 正文

取余操作在数据库里怎么用才快？聊聊那些高效编程的小技巧

符海莹
问答
2026-01-24 21:43:53
2

取余操作,在数据库里就是那个“%”符号，用来算一个数除以另一个数剩下的余数，你想把用户按身份证尾号分成5组，或者每隔7天做一个周期统计，都会用到它，但这个操作如果用得不好，特别在数据量大时，会拖慢整个查询，因为它通常会让数据库引擎做大量的计算，而且很难利用索引等优化手段。

为什么它容易慢？ 数据库处理“取余”时，通常需要为每一行数据都执行一次除法计算，这是一种逐行的、计算密集型的操作，如果是在WHERE子句里用，比如WHERE order_id % 10 = 1，数据库往往必须扫描整个表，对每一行的order_id都算一遍，才能知道哪些行符合条件，这就像让你在一本没目录的书里，找出所有页码尾数是1的页，你得一页页翻，更麻烦的是，大多数数据库的常规索引（B树索引）是基于值的直接查找建立的，而“取余后的结果”并没有直接的索引，除非你特意为它建立一个函数索引（但这也是一种额外的开销和维护）。

怎么让它快起来？聊聊几个实在的小技巧

最有效的一招：用位运算代替（如果除数是2的幂次方） 这是程序员老手们常用的秘籍，如果你要对一个数除以比如2、4、8、16、32……这些2的幂次方后取余，直接用“按位与”（&）运算会快得多，因为计算机底层处理位运算效率极高。
- 例子：你想把数据分成8组（0-7），常规写法是 id % 8，优化写法是 id & 7，原理是：一个数除以8的余数，只和这个数最后3个二进制位有关，& 7就是直接取出最后3位，结果完全一样，在MySQL、PostgreSQL等数据库里都支持位运算。
- 注意：这个方法有严格限制，除数必须是2的幂次方（如2,4,8,16,32...），但很多分组场景，比如分8个线程处理、分16个区，是可以用这个技巧的。
预计算，把结果存成新列 如果取余的条件是固定的，并且经常要在查询条件（WHERE）或连接条件（JOIN）里用，最踏实的办法是提前算好，你可以在表里直接增加一个列，比如叫group_id，在数据插入或更新时，就用程序逻辑或者数据库的触发器（Trigger）把 id % 100 的结果算好存进去，给这个group_id列建立普通的索引，这样，以后查询 WHERE group_id = 5 时，数据库就能嗖嗖地用索引查找了，速度快上几个数量级，这相当于把“实时计算”的成本转移到了“写数据”的时候，用空间换时间，很多大型互联网应用在处理分表分库的路由键时，实际上就采用了类似的思想。
分区表（Partitioning）的妙用 如果你用的是MySQL、PostgreSQL等支持分区功能的数据库，并且你的取余操作是为了数据分区（比如按用户ID分10个区），那么直接使用“哈希分区”或“取余分区”是数据库内核级别的优化，数据库会自动根据你定的分区规则，把数据存储到不同的物理文件块中，查询时，如果条件里包含了分区键（比如user_id % 10 = 3），数据库引擎可以智能地只扫描对应的那个分区，而不是全表，这叫做“分区裁剪”，效果立竿见影，但分区表的管理有一定复杂性，适合数据量非常大的场景。
在程序里算好，而不是在数据库里算 这是一个思维转变，我们习惯把逻辑都写在SQL里，但如果你要查询id % 100 = 5的所有数据，为什么不先在程序里确定好这个“5”，然后直接去数据库查id在某个特定范围的数据呢？这个例子可能不直接，更常见的场景是：如果你有一批ID要查询，并且要对它们取余过滤，更好的做法是先在程序内存里把这批ID全部取出来，然后在程序里进行取余计算和过滤，避免在数据库内对大量数据集进行复杂的函数计算，把计算压力分散开。
审视业务逻辑，看能否规避 这是最高级的优化，我们使用取余是为了实现“轮询”或“均匀分布”，给10个客服平均分配工单，与其每次分配时都去数据库里计算id % 10，不如在客服这个维度上维护一个计数器，用更简单的“谁当前最少就给谁”的算法，这个逻辑完全可以在应用内存或缓存（如Redis）里高效完成，完全避免在数据库核心表上频繁进行取余计算。

总结一下 想让数据库里的取余操作快起来，核心思路就几个：一是让计算离数据更近（用位运算）、二是把计算提前（预存列）、三是让数据库底层帮你优化（分区表）、四是把计算搬出去（程序端计算）、五是想想是不是非得这么干（业务逻辑优化），具体用哪招，得看你实际的场景、数据量和数据库类型，多测试，用实际执行计划（EXPLAIN）说话，总是没错的，在数据库里，能不用函数去折腾字段，就尽量别用，尤其是WHERE和JOIN子句里的字段。

（参考思路来源于数据库优化的一般性实践，如《高性能MySQL》中提及的对索引列使用函数的负面影响，以及PostgreSQL、Oracle等官方文档中关于函数索引和分区表的优化建议，同时结合了常见的Web后端开发经验。）

取余操作在数据库里怎么用才快？聊聊那些高效编程的小技巧