通過Java正則表達(dá)式去掉SQL代碼中回車換行和多余空格
更新時(shí)間:2012年09月13日 15:21:18 作者:
剛才在寫一個(gè)代碼工具,遇到SQL換行和多余空格的問題,導(dǎo)致處理很困難,于是寫了一個(gè)正則式,搞定了,特分享下方便需要的朋友
復(fù)制代碼 代碼如下:
public static void main(String[] args) {
String sql = "SELECT * FROM \n" +
" `testdb`.`foo` LIMIT 0, 100";
String s = "SELECT * FROM `testdb`.`foo` LIMIT 0, 100";
String sql2 = Pattern.compile(" {2,}").matcher(s).replaceAll(" ");
String sql3 = s.replaceAll(" {2,}"," ");
String sql4 = sql.replace('\r', ' ').replace('\n', ' ').replaceAll(" {2,}"," ");;
String sql5 = sql.replace('\r', ' ').replace('\n', ' ').replaceAll(" {2,}?"," ");;
String sql6 = sql.replace('\r', ' ').replace('\n', ' ').replaceAll(" {2,}+"," ");;
System.out.println(sql2);
System.out.println(sql3);
System.out.println(sql4);
System.out.println(sql5);
System.out.println(sql6);
}
輸出結(jié)果:
復(fù)制代碼 代碼如下:
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
SELECT * FROM `testdb`.`foo` LIMIT 0, 100
[code]
Process finished with exit code 0
結(jié)果可以看出,有一個(gè)是沒有去掉多余空格的。
可見java中的正則式,同樣含義的還有多重寫法,呵呵!其實(shí)主要是不同數(shù)量詞匹配模式在作怪:
原版API文檔中寫道:
Greedy 數(shù)量詞
X? X,一次或一次也沒有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超過 m 次
Reluctant 數(shù)量詞
X?? X,一次或一次也沒有
X*? X,零次或多次
X+? X,一次或多次
X{n}? X,恰好 n 次
X{n,}? X,至少 n 次
X{n,m}? X,至少 n 次,但是不超過 m 次
Possessive 數(shù)量詞
X?+ X,一次或一次也沒有
X*+ X,零次或多次
X++ X,一次或多次
X{n}+ X,恰好 n 次
X{n,}+ X,至少 n 次
X{n,m}+ X,至少 n 次,但是不超過 m 次
但是,沒有對(duì)三種方式進(jìn)行更詳細(xì)的說明,其實(shí)三種模式的區(qū)別如下:
Greedy :嘗試找到最長(zhǎng)的匹配。
Reluctant :嘗試找到最短的匹配。
Possessive :也嘗試找到最長(zhǎng)的匹配。
盡管greedy和possessive迫使一個(gè)matcher在進(jìn)行第一次匹配之前讀取整個(gè)的text,greedy常常導(dǎo)致為了找到一個(gè)match進(jìn)行多次嘗試,然而possessive讓一個(gè)matcher僅嘗試一個(gè)match一次。
下面是一個(gè)我工具中的方法:
[code]
/**
* 判斷一條SQL語(yǔ)句是否已經(jīng)是分頁(yè)的SQL
*
* @param sql 源SQL
* @return 是已經(jīng)分頁(yè)的SQL時(shí)返回ture,否則返回False;
*/
public boolean isAlreadySegmentSQL(String sql) {
return sql.replace('\r', ' ').replace('\n', ' ').replaceAll(" {2,}", " ").matches("(?i).+LIMIT [\\d+ *|\\d *, *\\d+].+");
}
還是正則功能強(qiáng)悍??!
補(bǔ)充:
下面這個(gè)兩個(gè)注視的正則式,和第三個(gè)語(yǔ)意一樣的:
復(fù)制代碼 代碼如下:
// regList.put("(?i)bit\\([2-9]\\)\\z", "byte[]");
// regList.put("(?i)bit\\(\\d{2,}\\)\\z", "byte[]");
regList.put("(?i)bit\\((\\d{2,}|[2-9])\\)\\z", "byte[]");
本文出自 “熔 巖” 博客
相關(guān)文章
淺談?wù)齽t表達(dá)式(Regular Expression)
本文介紹了正則表達(dá)式的一些學(xué)習(xí)內(nèi)容,以及在Javascript、PHP下如何使用正則表達(dá)式2014-08-08
javascript正則表達(dá)式處理中文和中文標(biāo)點(diǎn)符號(hào)的過程
在寫項(xiàng)目時(shí)遇到需要匹配字符串中所有的漢字并且包括簡(jiǎn)單的中文標(biāo)點(diǎn)符號(hào),下面這篇文章主要給大家介紹了關(guān)于javascript正則表達(dá)式處理中文和中文標(biāo)點(diǎn)符號(hào)的相關(guān)資料,需要的朋友可以參考下2024-02-02

