一、一些常見的sql實踐
(1)負向條件查詢不能使用索引
select?*?from?order?where?status!=0?and?stauts!=1
not in/not exists都不是好習慣
可以優化為in查詢:
select?*?from?order?where?status?in(2,3)
(2)前導模糊查詢不能使用索引
select?*?from?order?where?desc?like?'%XX'
而非前導模糊查詢則可以:
select?*?from?order?where?desc?like?'XX%'
(3)數據區分度不大的字段不宜使用索引
select?*?from?user?where?sex=1
原因:性別只有男,女,每次過濾掉的數據很少,不宜使用索引。?
經驗上,能過濾80%數據時就可以使用索引。對于訂單狀態,如果狀態值很少,不宜使用索引,如果狀態值很多,能夠過濾大量數據,則應該建立索引。
(4)在屬性上進行計算不能命中索引
select?*?from?order?where?YEAR(date)?<p>即使date上建立了索引,也會全表掃描,可優化為值計算:</p><pre class="brush:sql;toolbar:false">select?*?from?order?where?date?<p>或者:</p><pre class="brush:sql;toolbar:false">select?*?from?order?where?date?<p><strong> 二、并非周知的SQL實踐</strong></p><p>(5)如果業務大部分是單條查詢,使用Hash索引性能更好,例如用戶中心</p><pre class="brush:sql;toolbar:false">select?*?from?user?where?uid=? select?*?from?user?where?login_name=?
原因:
B-Tree索引的時間復雜度是O(log(n))
Hash索引的時間復雜度是O(1)
(6)允許為NULL的列,查詢有潛在大坑
單列索引不存null值,復合索引不存全為null的值,如果列允許為null,可能會得到“不符合預期”的結果集
select?*?from?user?where?name?!=?'shenjian'
如果name允許為null,索引不存儲null值,結果集中不會包含這些記錄。
所以,請使用not null約束以及默認值。
(7)復合索引最左前綴,并不是值SQL語句的where順序要和復合索引一致
用戶中心建立了(login_name, passwd)的復合索引
select?*?from?user?where?login_name=??and?passwd=? select?*?from?user?where?passwd=??and?login_name=?
都能夠命中索引?
select?*?from?user?where?login_name=?
也能命中索引,滿足復合索引最左前綴?
select?*?from?user?where?passwd=?
不能命中索引,不滿足復合索引最左前綴
ENUM保存的是TINYINT,別在枚舉中搞一些“中國”“北京”“技術部”這樣的字符串,字符串空間又大,效率又低。
三、小眾但有用的SQL實踐
(9)如果明確知道只有一條結果返回,limit 1能夠提高效率
select?*?from?user?where?login_name=?
可以優化為:
select?*?from?user?where?login_name=??limit?1
原因:
你知道只有一條結果,但數據庫并不知道,明確告訴它,讓它主動停止游標移動
(10)把計算放到業務層而不是數據庫層,除了節省數據的CPU,還有意想不到的查詢緩存優化效果
select?*?from?order?where?date?<p>這不是一個好的SQL實踐,應該優化為:</p><pre class="brush:sql;toolbar:false">$curDate?=?date('Y-m-d'); $res?=?mysql_query( ????'select?*?from?order?where?date?<p>原因:</p><p>釋放了數據庫的CPU</p><p>多次調用,傳入的SQL相同,才可以利用查詢緩存</p><p>(11)強制類型轉換會全表掃描</p><pre class="brush:sql;toolbar:false">select?*?from?user?where?phone=13800001234
你以為會命中phone索引么?大錯特錯了,這個語句究竟要怎么改??
末了,再加一條,不要使用select *,只返回需要的列,能夠大大的節省數據傳輸量,與數據庫的內存使用量喲。