數據庫 30 條軍規
一、基礎規范
(1)必須使用 InnoDB 存儲引擎
解讀:支持事務、行級鎖、并發性能更好、CPU 及內存緩存頁優化使得資源利用率更高
(2)必須使用 UTF8 字符集
解讀:萬國碼,無需轉碼,無亂碼風險,節省空間
(3)數據表、數據字段必須加入中文注釋
解讀:N 年后誰 tm 知道這個 r1, r2, r3 字段是干嘛的
(4)禁止使用存儲過程、視圖、觸發器、Event
解讀:高并發大數據的互聯網業務,架構設計思路是“解放數據庫CPU,將計算轉移到服務層”,并發量大的情況下,這些功能很可能將數據庫拖死,業務邏輯放到服務層具備更好的擴展性,能夠輕易實現“增機器就加性能”。數據庫擅長存儲與索引,CPU 計算還是上移吧
(5)禁止存儲大文件或者大照片
解讀:為何要讓數據庫做它不擅長的事情?大文件和照片存儲在文件系統,數據庫里存URI多好
二、命名規范
(6)只允許使用內網域名,而不是 ip 連接數據庫
(7)線上環境、開發環境、測試環境數據庫內網域名遵循命名規范
● 業務名稱:xxx
●?線上環境:dj.xxx.db
●?開發環境:dj.xxx.rdb
●?測試環境:dj.xxx.tdb
●?從庫在名稱后加 -s 標識,備庫在名稱后加 -ss 標識
●?線上從庫:dj.xxx-s.db
●?線上備庫:dj.xxx-sss.db
(8)庫名、表名、字段名:小寫,下劃線風格,不超過 32 個字符,必須見名知意,禁止拼音英文混用
(9)表名 t_xxx,非唯一索引名 idx_xxx,唯一索引名 uniq_xxx
三、表設計規范
(10)單實例表數目必須小于 500
(11)單表列數目必須小于 30
(12)表必須有主鍵,例如自增主鍵
解讀:
* a)主鍵遞增,數據行寫入可以提高插入性能,可以避免 `page` 分裂,減少表碎片提升空間和內存的使用
* b)主鍵要選擇較短的數據類型, Innodb 引擎普通索引都會保存主鍵的值,較短的數據類型可以有效的減少索引的磁盤空間,提高索引的緩存效率
* c) 無主鍵的表刪除,在 row 模式的主從架構,會導致備庫夯住
(13)禁止使用外鍵,如果有外鍵完整性約束,需要應用程序控制
解讀:外鍵會導致表與表之間耦合,update 與 delete 操作都會涉及相關聯的表,十分影響 sql 的性能,甚至會造成死鎖。高并發情況下容易造成數據庫性能,大數據高并發業務場景數據庫使用以性能優先
四、字段設計規范
(14)必須把字段定義為 NOT NULL 并且提供默認值
解讀:
* a)null 的列使索引/索引統計/值比較都更加復雜,對 MySQL 來說更難優化
* b)null 這種類型 MySQL 內部需要進行特殊處理,增加數據庫處理記錄的復雜性;同等條件下,表中有較多空字段的時候,數據庫的處理性能會降低很多
* c)null 值需要更多的存儲空,無論是表還是索引中每行中的 null 的列都需要額外的空間來標識
* d)對 null 的處理時候,只能采用 `is null` 或 `is not null`,而不能采用 `=、in、、!=、not in` 這些操作符號。如:where name!=’shenjian’,如果存在 name 為 null 值的記錄,查詢結果就不會包含 name 為 null 值的記錄
(15)禁止使用 TEXT、BLOB 類型
解讀:會浪費更多的磁盤和內存空間,非必要的大量的大字段查詢會淘汰掉熱數據,導致內存命中率急劇降低,影響數據庫性能
(16)禁止使用小數存儲貨幣
解讀:使用整數吧,小數容易導致錢對不上
(17)必須使用 varchar(20) 存儲手機號
解讀:
* a)涉及到區號或者國家代號,可能出現 `+-()`
* b)手機號會去做數學運算么?
* c)varchar 可以支持模糊查詢,例如:`like“138%”`
(18)禁止使用 ENUM,可使用 TINYINT 代替
解讀:
* a)增加新的 ENUM 值要做 DDL 操作
* b)ENUM 的內部實際存儲就是整數,你以為自己定義的是字符串?
五、索引設計規范
(19)單表索引建議控制在 5 個以內
(20)單索引字段數不允許超過 5 個
解讀:字段超過 5 個時,實際已經起不到有效過濾數據的作用了
(21)禁止在更新十分頻繁、區分度不高的屬性上建立索引
解讀:
* a)更新會變更 B+ 樹,更新頻繁的字段建立索引會大大降低數據庫性能
* b)“性別”這種區分度不大的屬性,建立索引是沒有什么意義的,不能有效過濾數據,性能與全表掃描類似
(22)建立組合索引,必須把區分度高的字段放在前面
解讀:能夠更加有效的過濾數據
六、SQL使用規范
(23)禁止使用 SELECT *,只獲取必要的字段,需要顯示說明列屬性
解讀:
* a)讀取不需要的列會增加 CPU、IO、NET 消耗
* b)不能有效的利用覆蓋索引
* c)使用 `SELECT *` 容易在增加或者刪除字段后出現程序BUG
(24)禁止使用 INSERT INTO t_xxx VALUES(xxx),必須顯示指定插入的列屬性
解讀:容易在增加或者刪除字段后出現程序BUG
(25)禁止使用屬性隱式轉換
解讀:`SELECT uid FROM t_user WHERE phone=13812345678` 會導致全表掃描,而不能命中 phone 索引,猜猜為什么?(這個線上問題不止出現過一次)
(26)禁止在 WHERE 條件的屬性上使用函數或者表達式
解讀:`SELECT uid FROM t_user WHERE from_unixtime(day)>=’2017-02-15’` 會導致全表掃描
正確的寫法是:`SELECT uid FROM t_user WHERE day>= unix_timestamp(‘2017-02-15 00:00:00’)`
(27)禁止負向查詢,以及%開頭的模糊查詢
解讀:
* a)負向查詢條件:`NOT、!=、、!、NOT IN、NOT LIKE` 等,會導致全表掃描
* b)`%` 開頭的模糊查詢,會導致全表掃描
(28)禁止大表使用 JOIN 查詢,禁止大表使用子查詢
解讀:會產生臨時表,消耗較多內存與 CPU,極大影響數據庫性能
(29)禁止使用 OR 條件,必須改為 IN 查詢
解讀:舊版本 Mysql 的 OR 查詢是不能命中索引的,即使能命中索引,為何要讓數據庫耗費更多的 CPU 幫助實施查詢優化呢?
(30)應用程序必須捕獲 SQL 異常,并有相應處理
總結:大數據量高并發的互聯網業務,極大影響數據庫性能的都不讓用,不讓用喲。
推薦學習:MySQL教程