織夢cms如何通過正則批量查找替換數據庫的自定義內容

織夢cms如何通過正則批量查找替換數據庫的自定義內容

織夢cms如何通過正則批量查找替換數據庫的自定義內容?

正則的表達式在MY SQL中也有應用,但是在具體將查找的東西直接進行Replace的時候目前還不能解決,幸好后臺中有個dede利用正則,利用dede正則批量替換數據庫中內容,這樣我們完全減小了自己的工作量了

推薦學習:織夢cms

??

例如網站的一個例子

是替換一個div中的內容,摘抄實踐下,關鍵還是自己去體會,多用下正則,還是不錯的、正則相關的文章我在我的博客中也多次提到了他的多種運用途徑。如果你都掌握好它的話,你的工作效率就會成倍的提高了。

下面這個正則的用途是查找數據庫的中自定義的DIV層中運用,一般這種用法你在采集,或者,用word直接添加內容后會用到。

看看這個是如何去除的。

例子一,去除簡單自定義內容內容

選擇數據表與字段:dede_addonarticle

替換方式:選擇正則表達式

主鍵字段:aid

被替換內容:MM[d]*GG

選擇字段:body(這表是存儲文章內容的),選擇單選框:正則表達式,主鍵字段填寫”aid”,被替換內容為上面的正則:

例:MM[d]*GG

替換為:可為空,也可填寫你想置換為的內容。

替換條件:如果是全部,就不填寫。開始測試時,先備份了數據庫,然后僅替換一篇文章,條件中填寫:aid=888,如果是分類,就填寫:typeid=18,這樣縮小替換范圍,避免出錯。

填寫安全確認碼,替換就ok了,

例子二,去除

*

內容

<div> <font>文章地址址:<br>//www.jb51.net/<br></font>?</div>

上述代碼,是一個不錯的style,大家可以顯示下,調試效果不錯。

可以利用以下正則來替換:

]*”>(.*)

在dede后臺,選擇:核心–數據庫內容替換–選擇表:?

選擇數據表與字段:dede_addonarticle

替換方式:選擇正則表達式

主鍵字段:aid

被替換內容:

]*”>(.*)

選擇字段:body(這表是存儲文章內容的),選擇單選框:正則表達式,主鍵字段填寫”aid”,被替換內容為上面的正則:

例:

]*”>(.*)

替換為:可為空,也可填寫你想置換為的內容。

替換條件:如果是全部,就不填寫。?

注意:開始測試時,先備份了數據庫,然后僅替換一篇文章,條件中填寫:aid=8880,如果是分類,就填寫:typeid=18,這樣縮

小替換范圍,避免出錯。

填寫安全確認碼,替換就ok了,注意這個安全確認碼會有失效周期,但它自己不提示,也有這個可能,會選擇替換無反應,遇見

這情況,只有刷新當前頁面了。

很完整了吧!其它正則參考:http://bbs.dedecms.com/214856.html,這個當中的也不完整,也不太正確,需要對比來修改調試

,很費時間。?

正則是個好技術,有著很強大的應用,花了點時間看,你的工作效果會大陪的提高!

這是我在處理文章時用到一些正則表達式,里面有你要的。在Editplus中使用。

在表:dede_addonarticle中,body字段即是文章內容。

過濾Table相關的:

]*)>|

|

|

|

|

|

|

?

正則: width=”[0-9][0-9][0-9]”| width=[0-9][0-9][0-9]| height=”[0-9][0-9][0-9]”| height=[0-9][0-9][0-9],

說明:過慮height、Width。?

正則:

]*”>|

]*>|

|

,注意:匹配

或者

。?

正則: style=”[^”]*”| style=[^”]*,注意:匹配Style=”border:”?

正則:

,注意:匹配

正則:]*>|||]*>|| ,注意:匹配

正則: border=”[0-9]”| border=[0-9],注意:匹配border=””

正則:]*>|| ,注意:匹配

正則: id=[^ ]*| id=”[^ ]*”,注意:匹配id=””

正則: title=[0-9][^ ]*| title=”[0-9][^ ]*”| alt=[0-9][^ ]*| alt=”[0-9][^ ]*”| alt=[a-z][^ ]*| alt=”[a

-z][^ ]*”,注意:匹配Title或者alt

正則:]*–>,說明:匹配HTML注釋

正則:<script>]*)>(.*)</script>,說明:匹配<script></script>之間的全部內容

正則: class=[a-z][^ |^>]*| class=”[a-z][^ |^>]*”,說明:清理class=””,經過充分測試

正則:

]*)>|

|

|

|

|

|

|

正則:

]*>|

|

| align=left|||

|
|]*)>|

正則表達式是一種通用的標準,大部分計算機語言都支持正則表達式,包括as3,這里轉摘出了一些常用的正則表達式語句,大家用到的時候就不用自己寫了

^[0-9]*[1-9][0-9]*$  //匹配正整數?

^-[0-9]*[1-9][0-9]*$  //匹配負整數?

^-?d+$    //匹配整數?

^d+(.d+)?$  //匹配非負浮點數(正浮點數 + 0)?

^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$  //匹配正浮點數?

^((-d+(.d+)?)|(0+(.0+)?))$  //匹配非正浮點數(負浮點數 + 0)?

^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$  //匹配負浮點數?

^(-?d+)(.d+)?$  //匹配浮點數?

^[A-Za-z]+$  //匹配由26個英文字母組成的字符串?

^[A-Z]+$  //匹配由26個英文字母的大寫組成的字符串?

^[a-z]+$  //匹配由26個英文字母的小寫組成的字符串?

^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字符串?

^w+$  //匹配由數字、26個英文字母或者下劃線組成的字符串?

^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$    //匹配email地址?

^[a-zA-z]+://匹配(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$  //匹配url?

匹配中文字符的正則表達式: [u4e00-u9fa5]?

匹配雙字節字符(包括漢字在內):[^x00-xff]?

匹配空行的正則表達式:n[s| ]*r?

匹配HTML標記的正則表達式:/.*|/?

匹配首尾空格的正則表達式:(^s*)|(s*$)?

匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*?

匹配網址URL的正則表達式:^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$?

匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$?

匹配國內電話號碼:(d{3}-|d{4}-)?(d{8}|d{7})??

匹配騰訊QQ號:^[1-9]*[1-9][0-9]*$?

下表是元字符及其在正則表達式上下文中的行為的一個完整列表:?

將下一個字符標記為一個特殊字符、或一個原義字符、或一個后向引用、或一個八進制轉義符。?

^ 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的Multiline 屬性,^ 也匹配 ‘n’ 或 ‘r’ 之后的位置。?

$ 匹配輸入字符串的結束位置。如果設置了 RegExp 對象的Multiline 屬性,$ 也匹配 ‘n’ 或 ‘r’ 之前的位置。?

* 匹配前面的子表達式零次或多次。?

+ 匹配前面的子表達式一次或多次。+ 等價于 {1,}。?

? 匹配前面的子表達式零次或一次。? 等價于 {0,1}。?

{n} n 是一個非負整數,匹配確定的n 次。?

{n,} n 是一個非負整數,至少匹配n 次。?

{n,m} m 和 n 均為非負整數,其中n

? 當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹

配所搜索的字符串,而默認的貪婪模式則盡可能多的匹配所搜索的字符串。?

. 匹配除 “n” 之外的任何單個字符。要匹配包括 ‘n’ 在內的任何字符,請使用象 ‘[.n]’ 的模式。?

(pattern) 匹配pattern 并獲取這一匹配。?

(?:pattern) 匹配pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以后使用。

(?=pattern) 正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要

獲取供以后使用。?

(?!pattern) 負向預查,與(?=pattern)作用相反?

x|y 匹配 x 或 y。?

[xyz] 字符集合。?

[^xyz] 負值字符集合。?

[a-z] 字符范圍,匹配指定范圍內的任意字符。?

[^a-z] 負值字符范圍,匹配任何不在指定范圍內的任意字符。?

b 匹配一個單詞邊界,也就是指單詞和空格間的位置。?

B 匹配非單詞邊界。?

cx 匹配由x指明的控制字符。?

d 匹配一個數字字符。等價于 [0-9]。?

D 匹配一個非數字字符。等價于 [^0-9]。?

f 匹配一個換頁符。等價于 x0c 和 cL。?

n 匹配一個換行符。等價于 x0a 和 cJ。?

r 匹配一個回車符。等價于 x0d 和 cM。?

s 匹配任何空白字符,包括空格、制表符、換頁符等等。等價于[ fnrtv]。?

S 匹配任何非空白字符。等價于 [^ fnrtv]。?

t 匹配一個制表符。等價于 x09 和 cI。?

v 匹配一個垂直制表符。等價于 x0b 和 cK。?

w 匹配包括下劃線的任何單詞字符。等價于'[A-Za-z0-9_]’。?

W 匹配任何非單詞字符。等價于 ‘[^A-Za-z0-9_]’。?

xn 匹配 n,其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。?

num 匹配 num,其中num是一個正整數。對所獲取的匹配的引用。?

n 標識一個八進制轉義值或一個后向引用。如果 n 之前至少 n 個獲取的子表達式,則 n 為后向引用。否則,如果 n 為八進

制數字 (0-7),則 n 為一個八進制轉義值。?

nm 標識一個八進制轉義值或一個后向引用。如果 nm 之前至少有is preceded by at least nm 個獲取得子表達式,則 nm 為

后向引用。如果 nm 之前至少有 n 個獲取,則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足,若 n 和 m 均為

八進制數字 (0-7),則 nm 將匹配八進制轉義值 nm。?

nml 如果 n 為八進制數字 (0-3),且 m 和 l 均為八進制數字 (0-7),則匹配八

關于批量替換 正則表達式

這是我在處理文章時用到一些正則表達式,里面有你要的。在Editplus中使用。

在表:dede_addonarticle中,body字段即是文章內容。

過濾Table相關的:

]*)>|

|

|

|

|

|

|

還有一些,可供你參考,我加了一些注釋,發個貼太累了,哎~~~自己摸索吧:

正則: width=”[0-9][0-9][0-9]”| width=[0-9][0-9][0-9]| height=”[0-9][0-9][0-9]”| height=[0-9][0-9][0-9],說明:過慮height、Width。

——————————————————

正則:

]*”>|

]*>|

|

,注意:匹配

或者

。

——————————————————

正則: style=”[^”]*”| style=[^”]*,注意:匹配Style=”border:”

——————————————————

正則:

,注意:匹配

——————————————————

正則:]*>|||]*>|| ,注意:匹配

——————————————————

正則: border=”[0-9]”| border=[0-9],注意:匹配border=””

——————————————————

正則:]*>|| ,注意:匹配

——————————————————

正則: id=[^ ]*| id=”[^ ]*”,注意:匹配id=“”?

——————————————————

正則: title=[0-9][^ ]*| title=”[0-9][^ ]*”| alt=[0-9][^ ]*| alt=”[0-9][^ ]*”| alt=[a-z][^ ]*| alt=”[a-z][^ ]*”,注意:匹配Title或者alt

——————————————————

正則:,說明:匹配HTML注釋

——————————————————

正則:<script>]*)>(.*)</script>,說明:匹配<script></script>之間的全部內容

——————————————————

正則: class=[a-z][^ |^>]*| class=”[a-z][^ |^>]*”,說明:清理class=””,經過充分測試

——————————————————

正則:

]*)>|

|

|

|

|

|

|

——————————————————

正則:

]*>|

|

| align=left|||

|
|]*)>|

? 版權聲明
THE END
喜歡就支持一下吧
點贊5 分享