当前位置：首页 > 问答 > 正文

SQL Server索引那些必须知道的关键原则和实用技巧分享

符海莹
问答
2025-12-24 22:25:01
6

索引就像是数据库书籍最后的目录，没有它，要找一段特定的内容（数据）就需要一页一页地翻（全表扫描），效率极低，在SQL Server中，正确使用索引是提升查询性能最关键的手段之一,以下是一些必须知道的原则和实用技巧。

关键原则：理解索引是如何工作的

索引的本质是排序： 数据库索引的本质是一个独立的数据结构，它包含了表中某一列或多列值的副本，并按照一定的顺序（升序或降序）存储，它保留了指向表中对应数据行的指针（类似于书目录的页码），正因为数据是有序的，数据库可以使用高效的查找算法（如二分查找）快速定位数据，而不是扫描整个表,这个原理在微软的官方文档中关于索引架构的部分有详细阐述。
聚簇索引定义数据的物理顺序： 这是最重要的原则之一，一个表只能有一个聚簇索引，因为它决定了表中数据行在磁盘上的实际存储顺序，如果把表想象成一本书，那么聚簇索引就是这本书的页码顺序，内容本身是按照页码排列的，选择哪个列作为聚簇索引键至关重要，通常建议使用单调递增的列，如自增主键（IDENTITY），这样可以减少页分裂,提高插入性能。
非聚簇索引是独立的目录： 一个表可以有多个非聚簇索引，它就像一本书后面的专业术语索引，索引项（例如关键词）按字母顺序排列，每个关键词后面跟着一个或多个页码，非聚簇索引本身也是有序的，但它不影响数据行的物理顺序，当通过非聚簇索引查找数据时，数据库先找到索引条目，再通过指针去查找实际的数据行，这个过程可能产生额外的开销（键查找）。
索引的代价： 索引不是免费的午餐，它需要占用额外的磁盘空间，更重要的是，每次对表进行增（INSERT）、删（DELETE）、改（UPDATE）操作时，数据库都需要维护相应的索引，这会带来额外的性能开销，索引不是越多越好,需要平衡查询性能和数据更新效率。

实用技巧：如何设计和优化索引

为查询的WHERE子句和JOIN条件创建索引： 这是最直接的技巧，分析你最频繁、最耗时的查询语句，看它们在哪些列上进行过滤（WHERE column = value）或连接（ON table1.column = table2.column），为这些列创建索引通常能带来最显著的性能提升，一个经常按“客户ID”查询订单的语句，就应该在订单表的“客户ID”列上建立索引。
考虑创建复合索引（多列索引）： 当查询条件涉及多个列时，复合索引比多个单列索引更有效，查询经常是 WHERE city='北京' AND last_name='张'，那么一个在 (city, last_name) 上的复合索引会非常高效，这里有一个关键技巧叫“最左前缀原则”，意思是查询必须使用到复合索引的最左边的列，索引才会被有效使用，如果把上面的索引顺序颠倒为 (last_name, city),那么只按city查询时就无法使用这个索引。
小心索引选择性： 索引的选择性是指索引列中不同值的数量占总行数的比例，比例越高，选择性越好，索引效率也越高，在“性别”这种只有‘男’、‘女’两个值的列上建索引，选择性很差，因为数据库通过索引会得到大量的行指针，最终可能还不如全表扫描快，而像“身份证号”、“用户名”这类几乎唯一的列，选择性极高,是非常理想的索引候选列。
包含列（INCLUDE）来避免键查找： 这是SQL Server提供的一个非常实用的功能，如果查询只需要从索引中获取数据，而无需回表查找，这个索引就被称为“覆盖索引”，性能极佳，我们可以使用INCLUDE子句将查询中需要返回、但不需要用于过滤的列包含在非聚簇索引的叶子节点中，对于查询 SELECT order_id, order_date FROM orders WHERE customer_id = 123，可以创建一个索引：CREATE INDEX IX_Orders_CustomerID ON orders(customer_id) INCLUDE (order_date)，这样，数据库只需扫描索引就能获得所有数据,避免了昂贵的键查找操作。
定期检查和维护索引： 索引在使用过程中会产生碎片，包括逻辑碎片（页拆分导致页不连续）和空间碎片（页空间利用率低），碎片化的索引会降低查询速度，需要定期使用 ALTER INDEX ... REORGANIZE 或 ALTER INDEX ... REBUILD 来重建或重新组织索引，以消除碎片，SQL Server也提供了动态管理视图（DMVs），如 sys.dm_db_index_physical_stats,来帮助分析索引的健康状况和碎片程度。
监控索引的使用情况： 不是所有创建的索引都会被用到，可以使用SQL Server提供的动态管理视图 sys.dm_db_index_usage_stats 来查看索引的使用次数，对于那些长期不被使用的索引，可以考虑删除,以减少对数据更新操作的影响。
谨慎对待Like模糊查询： 当使用LIKE进行模糊查询时，如果通配符（%）在开头，如 LIKE '%关键字'，大多数情况下索引会失效，导致全表扫描，应尽量避免这种写法，或者考虑使用全文索引（Full-Text Index）等更适合模糊搜索的技术。