索引是什么?
數據庫中查找操作非常普遍,索引就是提升查找速度的一種手段。
索引分類
-
B+樹索引
它就是傳統意義上的索引,它是最常用、最有效的索引。 -
哈希索引
哈希索引是一種自適應的索引,數據庫會根據表的使用情況自動生成哈希索引,我們人為是沒辦法干預的。 -
全文索引
用于實現關鍵詞搜索。但它只能根據空格分詞,因此不支持中文。
若要實現搜索功能,可選擇lucene。 -
RTree索引
在mysql很少使用,僅支持geometry數據類型;相對于BTREE,RTREE的優勢在于范圍查找。
B+樹索引
數據庫以頁為存儲單元,一個頁是8K(8192Byte),一頁可以存放N條記錄。
頁在B+樹中分為:數據頁和索引頁。
B+樹的高一般為2-4層,因此查找某一鍵值的行記錄只需2-4次IO,效率較高。
聚集索引 和 非聚集索引
不管是聚集索引還是非聚集索引,它們的邏輯結構都一棵是B+樹,它們的唯一區別在于:
-
聚集索引的數據頁存放的是完整的記錄;也就是說,聚集索引決定了表的物理存儲順序;
-
非聚集索引的數據頁只存指向記錄的地址信息,它真正的數據已經在聚集索引中存儲了。
聯合索引 和 覆蓋索引
-
聯合索引
當查詢條件涉及多列時,可以使用聯合索引。 -
覆蓋索引
只需通過輔助索引就能獲取要查詢的信息,而無需再次通過聚集索引查詢具體的記錄信息。
由于覆蓋索引并不包含整行的記錄,因此它的大小遠遠小于聚集索引。
它比較適合做一些統計操作。
MyISAM索引實現
-
主鍵索引
在主鍵索引中,索引頁中存放的是主鍵和指向數據頁的偏移量;數據頁中存放的是主鍵和該主鍵所屬行記錄的地址空間。 -
輔助索引
在MyISAM中,主索引和輔助索引(Secondary key)在結構上沒有任何區別,只是主索引要求key是唯一的,而輔助索引的key可以重復。
綜上所述,在MyISAM中,索引文件和數據文件分開存放,不管是主鍵索引還是輔助索引,都屬于非聚集索引。
InnoDB索引實現
-
主鍵索引
索引頁仍然存放主鍵和和指向數據頁的偏移量,但數據頁存放的是完整的記錄。
也就是在InnoDB中,數據和主鍵索引是存放在一起的。 -
輔助索引
索引節點存放的內容一樣,仍然是鍵值信息和指向數據頁的偏移量;但數據頁中存放的是鍵值信息和該鍵值對應的主鍵。然后通過主鍵查詢主鍵索引就能找到該條記錄。
綜上所述:
-
聚集索引這種實現方式使得按主鍵的搜索十分高效,但是輔助索引搜索需要檢索兩遍索引:首先檢索輔助索引獲得主鍵,然后用主鍵到主索引中檢索獲得記錄。
-
InnoDB的輔助索引也會包含主鍵列,所以,如果主鍵定義的比較大,其他索引也將很大。如果想在表上定義 、很多索引,則爭取盡量把主鍵定義得小一些。InnoDB 不會壓縮索引。
索引的優點
-
第一,通過創建唯一性索引,可以保證數據庫表中每一行數據的唯一性。
-
第二,可以大大加快數據的檢索速度,這也是創建索引的最主要的原因。
-
第三,可以加速表和表之間的連接,特別是在實現數據的參考完整性方面特別有意義。
-
第四,在使用分組和排序子句進行數據檢索時,同樣可以顯著減少查詢中分組和排序的時間。
-
第五,通過使用索引,可以在查詢的過程中,使用優化隱藏器,提高系統的性能。
索引的缺點
-
第一,創建索引和維護索引要耗費時間,這種時間隨著數據量的增加而增加。
-
第二,索引需要占物理空間,除了數據表占數據空間之外,每一個索引還要占一定的物理空間,如果要建立聚簇索引,那么需要的空間就會更大。
-
第三,當對表中的數據進行增加、刪除和修改的時候,索引也要動態的維護,這樣就降低了數據的維護速度。
哪些情況需要加索引?
-
在經常需要搜索的列上,可以加快搜索的速度;
-
在作為主鍵的列上,強制該列的唯一性和組織表中數據的排列結構;
-
在經常用在連接的列上,這些列主要是一些外鍵,可以加快連接的速度;
-
在經常需要根據范圍進行搜索的列上創建索引,因為索引已經排序,其指定的范圍是連續的;
-
在經常需要排序的列上創建索引,因為索引已經排序,這樣查詢可以利用索引的排序,加快排序查詢時間;
-
在經常使用在WHERE子句中的列上面創建索引,加快條件的判斷速度。
哪些情況不需要加索引?
-
第一,對于那些在查詢中很少使用或者參考的列不應該創建索引。這是因為,既然這些列很少使用到,因此有索引或者無索引,并不能提高查詢速度。相反,由于增加了索引,反而降低了系統的維護速度和增大了空間需求。
-
第二,對于那些只有很少數據值的列也不應該增加索引。這是因為,由于這些列的取值很少,例如人事表的性別列,在查詢的結果中,結果集的數據行占了表中數據行的很大比例,即需要在表中搜索的數據行的比例很大。增加索引,并不能明顯加快檢索速度。
-
第三,對于那些定義為text, image和bit數據類型的列不應該增加索引。這是因為,這些列的數據量要么相當大,要么取值很少。
第四,當修改性能遠遠大于檢索性能時,不應該創建索引。這是因為,修改性能和檢索性能是互相矛盾的。當增加索引時,會提高檢索性能,但是會降低修改性能。當減少索引時,會提高修改性能,降低檢索性能。因此,當修改性能遠遠大于檢索性能時,不應該創建索引。