Java正則表達(dá)式匹配字符串并提取中間值的方法實(shí)例
前言
有時(shí)候正則表達(dá)式不只是匹配一下什么數(shù)字/郵箱/身份證/日期等等,還需要匹配某一段文字,并按照既定格式提取其中的某些值.
場(chǎng)景一:提取SAML2報(bào)文
SAML2報(bào)文內(nèi)容如下,從中提取對(duì)應(yīng)的attribute name和value.
<saml:AttributeStatement>
<saml:Attribute Name="mail">
<saml:AttributeValue xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:type="xs:string">zhengkai.blog.csdn.net</saml:AttributeValue>
</saml:Attribute>
<saml:Attribute Name="cn">
<saml:AttributeValue xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:type="xs:string">amAdmin</saml:AttributeValue>
</saml:Attribute>
</saml:AttributeStatement>show time
public static void main(String[] args) {
String content = "";
content = "<saml:AttributeStatement>";
content += " <saml:Attribute Name=\"mail\">";
content += " <saml:AttributeValue xmlns:xs=\"http://www.w3.org/2001/XMLSchema\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\" xsi:type=\"xs:string\">zhengkai.blog.csdn.net</saml:AttributeValue>";
content += " </saml:Attribute>";
content += " <saml:Attribute Name=\"cn\">";
content += " <saml:AttributeValue xmlns:xs=\"http://www.w3.org/2001/XMLSchema\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\" xsi:type=\"xs:string\">amAdmin</saml:AttributeValue>";
content += " </saml:Attribute>";
content += "</saml:AttributeStatement>";
String pattern = "\\<saml\\:Attribute Name=\\\"(?<scope>.*?)\\\"\\>[\\s\\S]*?\\<saml\\:AttributeValue[\\s\\S]*?\\>(?<value>.*?)\\<\\/saml\\:AttributeValue\\>[\\s\\S]*?\\<\\/saml\\:Attribute\\>";
Pattern r = Pattern.compile(pattern);
Matcher matcher = r.matcher(saml2attributeString);
while (matcher.find()){
String attributeName = matcher.group("scope");
String attributeValue = matcher.group("value");
System.out.println("attributeName->"+attributeName +",attributeValue->"+attributeValue );
}
}
控制臺(tái)輸出
$ attributeName->mail,attributeValue->zhengkai.blog.csdn.net
$ vattributeName->cn,attributeValue->amAdmin
解析
\\<saml\\:Attribute Name=\\\"(?<scope>.*?)\\\"\\>[\\s\\S]*?\\<saml\\:AttributeValue[\\s\\S]*?\\>(?<value>.*?)\\<\\/saml\\:AttributeValue\\>[\\s\\S]*?\\<\\/saml\\:Attribute\\>
- (?<scope>.*?)是用于標(biāo)識(shí)scope的方式,表示夾在中間的字符串都叫scope,可以通過(guò)matcher.group("scope")提取。
- 所有非正則的符號(hào)都需要轉(zhuǎn)義,所以你會(huì)看到很多\\<或者換\\"之類(lèi)的\\
- [\\s\\S]*? 是用來(lái)匹配任意字符,表示在前后有界定的情況下(例如夾在<xxx></xxx>中間的字符串),可以忽略那些不規(guī)則字符串的匹配。
場(chǎng)景2:提取sql中的表名和字段
來(lái)自github網(wǎng)友@ydq 給SpringBootCodeGenerator貢獻(xiàn)的正則表達(dá)式,非常不錯(cuò),值得深刻學(xué)習(xí).
//匹配整個(gè)ddl,將ddl分為表名,列sql部分,表注釋
private static final Pattern DDL_PATTERN = Pattern.compile("\\s*create\\s+table\\s+(?<tableName>\\S+)[^\\(]*\\((?<columnsSQL>[\\s\\S]+)\\)[^\\)]+?(comment\\s*(=|on\\s+table)\\s*'(?<tableComment>.*?)'\\s*;?)?$", Pattern.CASE_INSENSITIVE);
//匹配列sql部分,分別解析每一列的列名 類(lèi)型 和列注釋
private static final Pattern COL_PATTERN = Pattern.compile("\\s*(?<fieldName>\\S+)\\s+(?<fieldType>\\w+)\\s*(?:\\([\\s\\d,]+\\))?((?!comment).)*(comment\\s*'(?<fieldComment>.*?)')?\\s*(,|$)", Pattern.CASE_INSENSITIVE);
public static void parse(String sql){
Matcher matcher = DDL_PATTERN.matcher(sql);
if (matcher.find()){
String tableName = matcher.group("tableName");
String tableComment = matcher.group("tableComment");
System.out.println(tableName + "\t\t" + tableComment);
System.out.println("==========");
String columnsSQL = matcher.group("columnsSQL");
if (columnsSQL != null && columnsSQL.length() > 0){
Matcher colMatcher = COL_PATTERN.matcher(columnsSQL);
while (colMatcher.find()){
String fieldName = colMatcher.group("fieldName");
String fieldType = colMatcher.group("fieldType");
String fieldComment = colMatcher.group("fieldComment");
if (!"key".equalsIgnoreCase(fieldType)){
System.out.println(fieldName + "\t\t" + fieldType + "\t\t" + fieldComment);
}
}
}
}
}
public static void main(String[] args){
System.out.println(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>");
parse("CREATE TABLE `userinfo` (\n" +
" `user_id` int(11) NOT NULL AUTO_INCREMENT COMMENT '用戶(hù)ID',\n" +
" `username` varchar(255) NOT NULL COMMENT '用戶(hù)名',\n" +
" `addtime` datetime NOT NULL COMMENT '創(chuàng)建時(shí)間',\n" +
" PRIMARY KEY (`user_id`)\n" +
") ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='用戶(hù)信息'");
System.out.println(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>");
parse("CREATE TABLE `USER` (\n" +
"`ID` varchar(32) PRIMARY KEY COMMENT '主鍵',\n" +
"`password` varchar(32) NOT NULL COMMENT '密碼',\n" +
"`username` varchar(32) NOT NULL COMMENT '用戶(hù)'\n" +
") ENGINE=InnoDB DEFAULT CHARSET=utf8;");
System.out.println(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>");
parse("CREATE TABLE `tb_amount` (\n" +
"`ID` int(10) NOT NULL AUTO_INCREMENT,\n" +
"`PRODUCT_CODE` varchar(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NOT NULL COMMENT '產(chǎn)品代碼',\n" +
"`GENDER` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '性別(male,female)',\n" +
"`MIN_INSURED_AGE` int(3) NULL DEFAULT NULL COMMENT '最小投保年齡',\n" +
"`MAX_INSURED_AGE` int(3) NULL DEFAULT NULL COMMENT '最大投保年齡',\n" +
"`AMOUNT` double(10, 2) NULL DEFAULT NULL COMMENT '基本保額',\n" +
"`PREMIUM_RATE` double(10, 2) NULL DEFAULT NULL COMMENT '基本保費(fèi)',\n" +
"`YEAR_NUM` int(3) NULL DEFAULT NULL COMMENT '繳費(fèi)年限',\n" +
"`PREMIUM_TYPE` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '費(fèi)率類(lèi)型',\n" +
"`INSURANCE_PERIOD` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '保險(xiǎn)期間(30年,60年)',\n" +
"`INSURANCE_PERIOD_TYPE` varchar(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '保險(xiǎn)期間類(lèi)型(如定期年0,定期歲1,終身2,以后終身對(duì)應(yīng)值:200)',\n" +
"`PAY_MODE` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '交費(fèi)方式',\n" +
"PRIMARY KEY (`ID`) USING BTREE\n" +
") ENGINE = InnoDB CHARACTER SET = utf8mb4 COLLATE = utf8mb4_0900_ai_ci ROW_FORMAT = Dynamic;");
}控制臺(tái)輸出內(nèi)容:
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
`userinfo` 用戶(hù)信息
==========
`user_id` int 用戶(hù)ID
`username` varchar 用戶(hù)名
`addtime` datetime 創(chuàng)建時(shí)間
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
`USER` null
==========
`ID` varchar 主鍵
`password` varchar 密碼
`username` varchar 用戶(hù)
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
`tb_amount` null
==========
`ID` int null
`PRODUCT_CODE` varchar 產(chǎn)品代碼
`GENDER` varchar 性別(male,female)
`MIN_INSURED_AGE` int 最小投保年齡
`MAX_INSURED_AGE` int 最大投保年齡
`AMOUNT` double 基本保額
`PREMIUM_RATE` double 基本保費(fèi)
`YEAR_NUM` int 繳費(fèi)年限
`PREMIUM_TYPE` varchar 費(fèi)率類(lèi)型
`INSURANCE_PERIOD` varchar 保險(xiǎn)期間(30年,60年)
`INSURANCE_PERIOD_TYPE` varchar 保險(xiǎn)期間類(lèi)型(如定期年0,定期歲1,終身2,以后終身對(duì)應(yīng)值:200)
`PAY_MODE` varchar 交費(fèi)方式
總結(jié)
到此這篇關(guān)于Java正則表達(dá)式匹配字符串并提取中間值的文章就介紹到這了,更多相關(guān)Java正則匹配字符串內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
SpringBoot?整合mapstruct的實(shí)現(xiàn)步驟
這篇文章主要介紹了SpringBoot整合mapstruct,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-11-11
Java Socket編程(三) 服務(wù)器Sockets
Java Socket編程(三) 服務(wù)器Sockets...2006-12-12
淺談Java由于不當(dāng)?shù)膱?zhí)行順序?qū)е碌乃梨i
為了保證線(xiàn)程的安全,我們引入了加鎖機(jī)制,但是如果不加限制的使用加鎖,就有可能會(huì)導(dǎo)致順序死鎖(Lock-Ordering Deadlock)。本文將會(huì)討論一下順序死鎖的問(wèn)題。2021-06-06
Java中的ClassLoader類(lèi)加載器使用詳解
這篇文章主要介紹了Java中的ClassLoader類(lèi)加載器使用詳解,ClassLoader用于將CLASS文件動(dòng)態(tài)加載到JVM中去,是所有類(lèi)加載器的基類(lèi),所有繼承自抽象的ClassLoader的加載器,都會(huì)優(yōu)先判斷是否被父類(lèi)加載器加載過(guò),防止多次加載,需要的朋友可以參考下2023-10-10
深入理解Java設(shè)計(jì)模式之訪(fǎng)問(wèn)者模式
這篇文章主要介紹了JAVA設(shè)計(jì)模式之訪(fǎng)問(wèn)者模式的的相關(guān)資料,文中示例代碼非常詳細(xì),供大家參考和學(xué)習(xí),感興趣的朋友可以了解2021-11-11
SpringBoot內(nèi)置tomcat啟動(dòng)原理詳解
這篇文章主要介紹了SpringBoot內(nèi)置tomcat啟動(dòng)原理詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04
Java中@DateTimeFormat注解與@JsonFormat注解的使用方式
這篇文章主要介紹了Java中@DateTimeFormat注解與@JsonFormat注解的使用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-08-08

