如何理解並正確使用 MySql 索引

1、概述

索引是存儲引擎用於快速查找記錄的一種數據結構，通過合理的使用數據庫索引可以大大提高系統的訪問性能，接下來主要介紹在 MySql 數據庫中索引類型，以及如何創建出更加合理且高效的索引技巧。

注：這裏主要針對的是 InnoDB 存儲引擎的 B+Tree 索引數據結構

2、索引的優點

1、大大減輕了服務器需要掃描的數據量，從而提高了數據的檢索速度

2、幫助服務器避免排序和臨時表

3、可以將隨機 I/O 變爲順序 I/O

3、索引的創建

3.1、主鍵索引

ALTER TABLE 'table_name' ADD PRIMARY KEY 'index_name' ('column');

3.2、唯一索引

ALTER TABLE 'table_name' ADD UNIQUE 'index_name' ('column');

3.3、普通索引

ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column');

3.4、全文索引

ALTER TABLE 'table_name' ADD FULLTEXT 'index_name' ('column');

3.5、組合索引

ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column1', 'column2', ...);

4、B+Tree 的索引規則

創建一個測試的用戶表

DROP TABLE IF EXISTS user_test;
CREATE TABLE user_test(
	id int AUTO_INCREMENT PRIMARY KEY,
	user_name varchar(30) NOT NULL,
	sex bit(1) NOT NULL DEFAULT b'1',
	city varchar(50) NOT NULL,
	age int NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

創建一個組合索引： ALTER TABLE user_test ADD INDEX idx_user(user_name , city , age);

4.1、索引有效的查詢

4.1.1、全值匹配

全值匹配指的是和索引中的所有列進行匹配，如：以上面創建的索引爲例，在 where 條件後可同時查詢（user_name，city，age）爲條件的數據。

注：與 where 後查詢條件的順序無關，這裏是很多同學容易誤解的一個地方

SELECT * FROM user_test WHERE user_name = 'feinik' AND age = 26 AND city = '廣州';

4.1.2、匹配最左前綴

匹配最左前綴是指優先匹配最左索引列，如：上面創建的索引可用於查詢條件爲：（user_name ）、（user_name, city）、（user_name , city , age）

注：滿足最左前綴查詢條件的順序與索引列的順序無關，如：（city, user_name）、（age, city, user_name）

4.1.3、匹配列前綴

指匹配列值的開頭部分，如：查詢用戶名以 feinik 開頭的所有用戶

SELECT * FROM user_test WHERE user_name LIKE 'feinik%';

4.1.4、匹配範圍值

如：查詢用戶名以 feinik 開頭的所有用戶，這裏使用了索引的第一列

SELECT * FROM user_test WHERE user_name LIKE 'feinik%';

4.2、索引的限制

1、where 查詢條件中不包含索引列中的最左索引列，則無法使用到索引查詢，如：

SELECT * FROM user_test WHERE city = '廣州';

或

SELECT * FROM user_test WHERE age= 26;

或

SELECT * FROM user_test WHERE city = '廣州' AND age = '26';

2、即使 where 的查詢條件是最左索引列，也無法使用索引查詢用戶名以 feinik 結尾的用戶

SELECT * FROM user_test WHERE user_name like '%feinik';

3、如果 where 查詢條件中有某個列的範圍查詢，則其右邊的所有列都無法使用索引優化查詢，如：

SELECT * FROM user_test WHERE user_name = 'feinik' AND city LIKE '廣州%' AND age = 26;

5、高效的索引策略

5.1、索引列不能是表達式的一部分，也不能作爲函數的參數，否則無法使用索引查詢。

SELECT * FROM user_test WHERE user_name = concat(user_name, 'fei');

5.2、前綴索引

有時候需要索引很長的字符列，這會增加索引的存儲空間以及降低索引的效率，一種策略是可以使用哈希索引，還有一種就是可以使用前綴索引，前綴索引是選擇字符列的前 n 個字符作爲索引，這樣可以大大節約索引空間，從而提高索引效率。

5.2.1、前綴索引的選擇性

前綴索引要選擇足夠長的前綴以保證高的選擇性，同時又不能太長，我們可以通過以下方式來計算出合適的前綴索引的選擇長度值：

（1）

SELECT COUNT(DISTINCT index_column)/COUNT(*) FROM table_name; -- index_column代表要添加前綴索引的列

注：通過以上方式來計算出前綴索引的選擇性比值，比值越高說明索引的效率也就越高效。

（2）

SELECT

COUNT(DISTINCT LEFT(index_column,1))/COUNT(*),

COUNT(DISTINCT LEFT(index_column,2))/COUNT(*),

COUNT(DISTINCT LEFT(index_column,3))/COUNT(*)

...

FROM table_name;

注：通過以上語句逐步找到最接近於（1）中的前綴索引的選擇性比值，那麼就可以使用對應的字符截取長度來做前綴索引了

5.2.2、前綴索引的創建

ALTER TABLE table_name ADD INDEX index_name (index_column(length));

5.2.3、使用前綴索引的注意點

前綴索引是一種能使索引更小，更快的有效辦法，但是 MySql 無法使用前綴索引做 ORDER BY 和 GROUP BY 以及使用前綴索引做覆蓋掃描。

5.3、選擇合適的索引列順序

在組合索引的創建中索引列的順序非常重要，正確的索引順序依賴於使用該索引的查詢方式，對於組合索引的索引順序可以通過經驗法則來幫助我們完成：將選擇性最高的列放到索引最前列，該法則與前綴索引的選擇性方法一致，但並不是說所有的組合索引的順序都使用該法則就能確定，還需要根據具體的查詢場景來確定具體的索引順序。

5.4 聚集索引與非聚集索引

1、聚集索引

聚集索引決定數據在物理磁盤上的物理排序，一個表只能有一個聚集索引，如果定義了主鍵，那麼 InnoDB 會通過主鍵來聚集數據，如果沒有定義主鍵，InnoDB 會選擇一個唯一的非空索引代替，如果沒有唯一的非空索引，InnoDB 會隱式定義一個主鍵來作爲聚集索引。

聚集索引可以很大程度的提高訪問速度，因爲聚集索引將索引和行數據保存在了同一個 B-Tree 中，所以找到了索引也就相應的找到了對應的行數據，但在使用聚集索引的時候需注意避免隨機的聚集索引（一般指主鍵值不連續，且分佈範圍不均勻），如使用 UUID 來作爲聚集索引性能會很差，因爲 UUID 值的不連續會導致增加很多的索引碎片和隨機 I/O，最終導致查詢的性能急劇下降。

2、非聚集索引

與聚集索引不同的是非聚集索引並不決定數據在磁盤上的物理排序，且在 B-Tree 中包含索引但不包含行數據，行數據只是通過保存在 B-Tree 中的索引對應的指針來指向行數據，如：上面在（user_name，city, age）上建立的索引就是非聚集索引。

5.5、覆蓋索引

如果一個索引（如：組合索引）中包含所有要查詢的字段的值，那麼就稱之爲覆蓋索引，如：

SELECT user_name, city, age FROM user_test WHERE user_name = 'feinik' AND age > 25;

因爲要查詢的字段（user_name, city, age）都包含在組合索引的索引列中，所以就使用了覆蓋索引查詢，查看是否使用了覆蓋索引可以通過執行計劃中的 Extra 中的值爲 Using index 則證明使用了覆蓋索引，覆蓋索引可以極大的提高訪問性能。

5.6、如何使用索引來排序

在排序操作中如果能使用到索引來排序，那麼可以極大的提高排序的速度，要使用索引來排序需要滿足以下兩點即可。

1、ORDER BY 子句後的列順序要與組合索引的列順序一致，且所有排序列的排序方向（正序 / 倒序）需一致
2、所查詢的字段值需要包含在索引列中，及滿足覆蓋索引

通過例子來具體分析

在 user_test 表上創建一個組合索引

ALTER TABLE user_test ADD INDEX index_user(user_name , city , age);

可以使用到索引排序的案例

1、SELECT user_name, city, age FROM user_test ORDER BY user_name;

2、SELECT user_name, city, age FROM user_test ORDER BY user_name, city;

3、SELECT user_name, city, age FROM user_test ORDER BY user_name DESC, city DESC;

4、SELECT user_name, city, age FROM user_test WHERE user_name = 'feinik' ORDER BY city;

注：第 4 點比較特殊一點，如果 where 查詢條件爲索引列的第一列，且爲常量條件，那麼也可以使用到索引

無法使用索引排序的案例

1、sex 不在索引列中

SELECT user_name, city, age FROM user_test ORDER BY user_name, sex;

2、排序列的方向不一致

SELECT user_name, city, age FROM user_test ORDER BY user_name ASC, city DESC;

3、所要查詢的字段列 sex 沒有包含在索引列中

SELECT user_name, city, age, sex FROM user_test ORDER BY user_name;

4、where 查詢條件後的 user_name 爲範圍查詢，所以無法使用到索引的其他列

SELECT user_name, city, age FROM user_test WHERE user_name LIKE 'feinik%' ORDER BY city;

5、多表連接查詢時，只有當 ORDER BY 後的排序字段都是第一個表中的索引列（需要滿足以上索引排序的兩個規則）時，方可使用索引排序。如：再創建一個用戶的擴展表 user_test_ext，並建立 uid 的索引。

DROP TABLE IF EXISTS user_test_ext;

CREATE TABLE user_test_ext(

    id int AUTO_INCREMENT PRIMARY KEY,

    uid int NOT NULL,

    u_password VARCHAR(64) NOT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

ALTER TABLE user_test_ext ADD INDEX index_user_ext(uid);

走索引排序

SELECT user_name, city, age FROM user_test u LEFT JOIN user_test_ext ue ON u.id = ue.uid ORDER BY u.user_name;

不走索引排序

SELECT user_name, city, age FROM user_test u LEFT JOIN user_test_ext ue ON u.id = ue.uid ORDER BY ue.uid;

6、總結

本文主要講了 B+Tree 樹結構的索引規則，不同索引的創建，以及如何正確的創建出高效的索引技巧來儘可能的提高查詢速度，當然了關於索引的使用技巧不單單隻有這些，關於索引的更多技巧還需平時不斷的積累相關經驗。

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://my.oschina.net/feinik/blog/1305784