一、首先要搞明白什么叫執(zhí)行計(jì)劃?
執(zhí)行計(jì)劃是數(shù)據(jù)庫根據(jù)sql語句和相關(guān)表的統(tǒng)計(jì)信息作出的一個(gè)查詢方案,這個(gè)方案是由查詢優(yōu)化器自動(dòng)分析產(chǎn)生的,比如一條SQL語句如果用來從一個(gè) 10萬條記錄的表中查1條記錄,那查詢優(yōu)化器會(huì)選擇“索引查找”方式,如果該表進(jìn)行了歸檔,當(dāng)前只剩下5000條記錄了,那查詢優(yōu)化器就會(huì)改變方案,采用“全表掃描”方式。
可見,執(zhí)行計(jì)劃并不是固定的,它是“個(gè)性化的”。產(chǎn)生一個(gè)正確的“執(zhí)行計(jì)劃”有兩點(diǎn)很重要:
(1)SQL語句是否清晰地告訴查詢優(yōu)化器它想干什么?
(2)查詢優(yōu)化器得到的數(shù)據(jù)庫統(tǒng)計(jì)信息是否是最新的、正確的?
二、統(tǒng)一SQL語句的寫法
對(duì)于以下兩句SQL語句,程序員認(rèn)為是相同的,數(shù)據(jù)庫查詢優(yōu)化器認(rèn)為是不同的。
select*from dual
select*From dual
其實(shí)就是大小寫不同,查詢分析器就認(rèn)為是兩句不同的SQL語句,必須進(jìn)行兩次解析。生成2個(gè)執(zhí)行計(jì)劃。所以作為程序員,應(yīng)該保證相同的查詢語句在任何地方都一致,多一個(gè)空格都不行!
三、SQL語句編寫注意問題
下面就某些SQL語句編寫注意問題做一下詳細(xì)的介紹。在這些where子句中,即使某些列存在索引,但是由于編寫了劣質(zhì)的SQL,系統(tǒng)在運(yùn)行該SQL語句時(shí)也不能使用該索引,而同樣使用全表掃描,這就造成了響應(yīng)速度的極大降低。
1.IS NULL 與 IS NOT NULL
不能用null作索引,任何包含null值的列都將不會(huì)被包含在索引中。即使索引有多列這樣的情況下,只要這些列中有一列含有null,該列就會(huì)從索引中排除。也就是說如果某列存在空值,即使對(duì)該列建索引也不會(huì)提高性能。
任何在where子句中使用is null或is not null的語句優(yōu)化器是不允許使用索引的。
2.避免使用不兼容的數(shù)據(jù)類型。
不兼容的數(shù)據(jù)類型代表著全表檢索數(shù)據(jù)的類型轉(zhuǎn)換,訪問將變?yōu)槿頀呙?/p>
select * from employee where last_name = 100;注last_name為varchar類型
3.聯(lián)接列
對(duì)于有聯(lián)接的列,即使最后的聯(lián)接值為一個(gè)靜態(tài)值,優(yōu)化器是不會(huì)使用索引的。我們一起來看一個(gè)例子,假定有一個(gè)職工表(employee),對(duì)于 一個(gè)職工的姓和名分成兩列存放(FIRST_NAME和LAST_NAME),現(xiàn)在要查詢一個(gè)叫比爾.克林頓(Bill Cliton)的職工。
下面是一個(gè)采用聯(lián)接查詢的SQL語句,
select * from employss where first_name||”||last_name =’Beill Cliton’;
上面這條語句完全可以查詢出是否有Bill Cliton這個(gè)員工,但是這里需要注意,系統(tǒng)優(yōu)化器對(duì)基于last_name創(chuàng)建的索引沒有使用。
當(dāng)采用下面這種SQL語句的編寫,oracle系統(tǒng)就可以采用基于last_name創(chuàng)建的索引。
*** where first_name =’Beill’ and last_name =’Cliton’;
4. 通配符(%)開頭的like語句
目前的需求是這樣的,要求在職工表中查詢名字中包含cliton的人。可以采用如下的查詢SQL語句:
select * from employee where last_name like ‘%cliton%’這里由于通配符(%)在搜尋詞首出現(xiàn),所以O(shè)racle系統(tǒng)不使用last_name的索引。然而當(dāng)通配符出現(xiàn)在字符串其他位置時(shí),優(yōu)化器就能利用索引。在下面的查詢中索引得到了使用:
select * from employee where last_name like ‘c%’
5.索引字段上進(jìn)行運(yùn)算會(huì)使索引失效。
盡量避免在WHERE子句中對(duì)字段進(jìn)行函數(shù)或表達(dá)式操作,這將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描。
eg:SELECT * FROM T1 WHERE F1/2=100 應(yīng)改為: SELECT * FROM T1 WHERE F1=100*2
6. Order by語句
ORDER BY語句決定了Oracle如何將返回的查詢結(jié)果排序。Order by語句對(duì)要排序的列沒有什么特別的限制,也可以將函數(shù)加入列中(象聯(lián)接或者附加等)。任何在Order by語句的非索引項(xiàng)或者有計(jì)算表達(dá)式都將降低查詢速度。
仔細(xì)檢查order by語句以找出非索引項(xiàng)或者表達(dá)式,它們會(huì)降低性能。解決這個(gè)問題的辦法就是重寫order by語句以使用索引,也可以為所使用的列建立另外一個(gè)索引,同時(shí)應(yīng)絕對(duì)避免在order by子句中使用表達(dá)式。
7. NOT
我們?cè)诓樵儠r(shí)經(jīng)常在where子句使用一些邏輯表達(dá)式,如大于、小于、等于以及不等于等等,也可以使用and(與)、or(或)以及not(非)。NOT可用來對(duì)任何邏輯運(yùn)算符號(hào)取反。下面是一個(gè)NOT子句的例子:
… where not (status =’VALID’)
如果要使用NOT,則應(yīng)在取反的短語前面加上括號(hào),并在短語前面加上NOT運(yùn)算符。NOT運(yùn)算符包含在另外一個(gè)邏輯運(yùn)算符中,這就是不等于()運(yùn)算符。換句話說,即使不在查詢where子句中顯式地加入NOT詞,NOT仍在運(yùn)算符中,見下例:
… where status ‘INVALID’;
對(duì)這個(gè)查詢,可以改寫為不使用NOT:
select * from employee where salary3000;
雖然這兩種查詢的結(jié)果一樣,但是第二種查詢方案會(huì)比第一種查詢方案更快些。第二種查詢?cè)试SOracle對(duì)salary列使用索引,而第一種查詢則不能使用索引。
8. IN和EXISTS
有時(shí)候會(huì)將一列和一系列值相比較。最簡(jiǎn)單的辦法就是在where子句中使用子查詢。在where子句中可以使用兩種格式的子查詢。
第一種格式是使用IN操作符:
… where column in(select * from … where …);
第二種格式是使用EXIST操作符:
… where exists (select ‘X’ from …where …);
我相信絕大多數(shù)人會(huì)使用第一種格式,因?yàn)樗容^容易編寫,而實(shí)際上第二種格式要遠(yuǎn)比第一種格式的效率高。在Oracle中可以幾乎將所有的IN操作符子查詢改寫為使用EXISTS的子查詢。
第二種格式中,子查詢以‘select ‘X’開始。運(yùn)用EXISTS子句不管子查詢從表中抽取什么數(shù)據(jù)它只查看where子句。這樣優(yōu)化器就不必遍歷整個(gè)表而僅根據(jù)索引就可完成工作(這里假定在where語句中使用的列存在索引)。相對(duì)于IN子句來說,EXISTS使用相連子查詢,構(gòu)造起來要比IN子查詢困難一些。
通過使用EXIST,Oracle系統(tǒng)會(huì)首先檢查主查詢,然后運(yùn)行子查詢直到它找到第一個(gè)匹配項(xiàng),這就節(jié)省了時(shí)間。Oracle系統(tǒng)在執(zhí)行IN子查詢時(shí),首先執(zhí)行子查詢,并將獲得的結(jié)果列表存放在一個(gè)加了索引的臨時(shí)表中。在執(zhí)行子查詢之前,系統(tǒng)先將主查詢掛起,待子查詢執(zhí)行完畢,存放在臨時(shí)表中以后再執(zhí)行主查詢。這也就是使用EXISTS比使用IN通常查詢速度快的原因。
同時(shí)應(yīng)盡可能使用NOT EXISTS來代替NOT IN,盡管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS要比NOT IN查詢效率更高。
9.應(yīng)盡量避免在 where 子句中使用or來連接條件,否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描,
如:select id from employee where num=10 or num=20
可以這樣查詢:select id from employee where num=10 union all select id from employeewhere num=20
10.應(yīng)盡量避免在 where 子句中對(duì)字段進(jìn)行表達(dá)式操作
這將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描。如:select id from t where num/2=100應(yīng)改為:select id from t where num=100*2
11.應(yīng)盡量避免在where子句中對(duì)字段進(jìn)行函數(shù)操作
這將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描。如:select id from t where substring(name,1,3)=’abc’ ,name以abc開頭的id應(yīng)改為:
select id from t where name like ‘a(chǎn)bc%’
12.不要在 where 子句中的“=”左邊進(jìn)行函數(shù)、算術(shù)運(yùn)算或其他表達(dá)式運(yùn)算,否則系統(tǒng)將可能無法正確使用索引。
13.在使用索引字段作為條件時(shí),如果該索引是復(fù)合索引,那么必須使用到該索引中的第一個(gè)字段作為條件時(shí)才能保證系統(tǒng)使用該索引,否則該索引將不會(huì)被使用,并且應(yīng)盡可能的讓字段順序與索引順序相一致。
14. 索引并不是越多越好
索引固然可以提高相應(yīng)的select的效率,但同時(shí)也降低了insert 及update的效率,因?yàn)?insert 或 update 時(shí)有可能會(huì)重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個(gè)表的索引數(shù)最好不要超過6個(gè),若太多則應(yīng)考慮一些不常使用到的列上建的索引是否有必要。
15.盡量使用數(shù)字型字段,若只含數(shù)值信息的字段盡量不要設(shè)計(jì)為字符型,這會(huì)降低查詢和連接的性能,并會(huì)增加存儲(chǔ)開銷。這是因?yàn)橐嬖谔幚聿樵兒瓦B接時(shí)會(huì)逐個(gè)比較字符串中每一個(gè)字符,而對(duì)于數(shù)字型而言只需要比較一次就夠了。
16.盡可能的使用 varchar/nvarchar 代替 char/nchar?,因?yàn)槭紫茸冮L字段存儲(chǔ)空間小,可以節(jié)省存儲(chǔ)空間,其次對(duì)于查詢來說,在一個(gè)相對(duì)較小的字段內(nèi)搜索效率顯然要高些。
17.任何地方都不要使用select * fromt,用具體的字段列表代替“*”,不要返回用不到的任何字段。