Golang 正則匹配效率詳解
最近有個(gè)小需求,校驗(yàn)IMEI是否為15位純數(shù)字(是否合法)
以下是正則匹配
與自己實(shí)現(xiàn)的簡(jiǎn)單驗(yàn)證方式進(jìn)行壓測(cè)
package main
import (
"regexp"
"testing"
)
func BenchmarkIsDigitalRegexp(b *testing.B) {
for i := 0; i < b.N; i++ {
_ = isDigitalRegexp("358901806972417")
}
}
func BenchmarkIsDigital(b *testing.B) {
for i := 0; i < b.N; i++ {
_ = isDigital("358901806972417")
}
}
func isDigitalRegexp(imei string) bool {
if ok, _ := regexp.Match("^[0-9]{15}$", []byte(imei)); ok {
return true
}else {
return false
}
}
func isDigital(imei string) bool {
n := len(imei)
if n == 15 {
for i := 0; i < n; i++ {
if imei[i] >= 48 && imei[i] <= 57 {
continue
}else {
return false
}
}
}else {
return false
}
return true
}
壓測(cè)結(jié)果:
C:\Users\M709FJSA\go\src\pprof_demo\re>go test -bench=. -benchmem goos: windows goarch: amd64 pkg: pprof_demo/re BenchmarkIsDigitalRegexp-12 300000 4644 ns/op 6450 B/op 70 allocs/op BenchmarkIsDigital-12 200000000 9.48 ns/op 0 B/op 0 allocs/op PASS ok pprof_demo/re 4.577s
很明顯,正則需要重新分配內(nèi)存較多,從pprof生成圖也可以看出,正則調(diào)用關(guān)系錯(cuò)綜復(fù)雜

補(bǔ)充:Golang —— 正則表達(dá)式
正則表達(dá)式是一種進(jìn)行模式匹配和文本操縱的復(fù)雜而又強(qiáng)大的工具。雖然正則表達(dá)式比純粹的文本匹配效率低,但是它卻更靈活。
按照它的語(yǔ)法規(guī)則,隨需構(gòu)造出的匹配模式就能夠從原始文本中篩選出幾乎任何你想要得到的字符組合。
Go語(yǔ)言通過(guò)regexp標(biāo)準(zhǔn)包為正則表達(dá)式提供了官方支持,如果你已經(jīng)使用過(guò)其他編程語(yǔ)言提供的正則相關(guān)功能,那么你應(yīng)該對(duì)Go語(yǔ)言版本的不會(huì)太陌生,但是它們之間也有一些小的差異,因?yàn)镚o實(shí)現(xiàn)的是RE2標(biāo)準(zhǔn),除了\C。
其實(shí)字符串處理我們可以使用strings包來(lái)進(jìn)行搜索(Contains、Index)、替換(Replace)和解析(Split、Join)等操作,但是這些都是簡(jiǎn)單的字符串操作,他們的搜索都是大小寫敏感,而且固定的字符串,如果我們需要匹配可變的那種就沒(méi)辦法實(shí)現(xiàn)了,當(dāng)然如果strings包能解決你的問(wèn)題,那么就盡量使用它來(lái)解決。
因?yàn)樗麄冏銐蚝?jiǎn)單、而且性能和可讀性都會(huì)比正則好。
正則匹配規(guī)則圖
詳細(xì)請(qǐng)參考官方文檔

簡(jiǎn)單的正則表達(dá)式
1. 匹配任意類型
buf := "abc azc a7c aac 888 a9c tac"
// 1. 解釋規(guī)則
reg := regexp.MustCompile(`a.c`) // 這里會(huì)解析正則表達(dá)式,成功就返回解釋器(. ——> 除\n外任意字符)
if reg == nil { // 解釋失敗
fmt.Println("MustCompile err")
return
}
// 2. 根據(jù)規(guī)則提取關(guān)鍵信息
res := reg.FindAllStringSubmatch(buf, -1) //-1表示匹配所有的
// res := reg.FindAllStringSubmatch(buf, 1) //1表示匹配一個(gè)
fmt.Println("res = ", res)
執(zhí)行結(jié)果:
res = [[abc] [azc] [a7c] [aac] [a9c]]
2. 使用 […] (字符集) 匹配[0-9]之間的數(shù)值
buf := "abc azc a7c aac 888 a9c tac"
//1) 解釋規(guī)則, 它會(huì)解析正則表達(dá)式,如果成功返回解釋器
reg1 := regexp.MustCompile(`a[0-9]c`)
if reg1 == nil { //解釋失敗,返回nil
fmt.Println("MustCompile err")
return
}
//2) 根據(jù)規(guī)則提取關(guān)鍵信息
result1 := reg1.FindAllStringSubmatch(buf, -1)
fmt.Println("result1 = ", result1)
執(zhí)行結(jié)果:
result1 = [[a7c] [a9c]]
3. 使用 \d 匹配[0-9]之間的數(shù)值
buf := "abc azc a7c aac 888 a9c tac"
//1) 解釋規(guī)則, 它會(huì)解析正則表達(dá)式,如果成功返回解釋器
reg1 := regexp.MustCompile(`a\dc`)
if reg1 == nil { //解釋失敗,返回nil
fmt.Println("MustCompile err")
return
}
//2) 根據(jù)規(guī)則提取關(guān)鍵信息
result1 := reg1.FindAllStringSubmatch(buf, -1)
fmt.Println("result1 = ", result1)
執(zhí)行結(jié)果:
result1 = [[a7c] [a9c]]
4.匹配小數(shù)
buf := "3.14 456 adsc as23d 1.23 3. 9.99 1lsa23d 0.08 0.00 "
// 解釋正則表達(dá)式
reg := regexp.MustCompile(`\d+\.\d+`) // +表示匹配前一個(gè)字符的一次或者多次
if reg == nil {
fmt.Println("MustCompile err")
return
}
// 提取關(guān)鍵信息
res := reg.FindAllStringSubmatch(buf, -1)
fmt.Println("res = ", res)
執(zhí)行結(jié)果:
res = [[3.14] [1.23] [9.99] [0.08] [0.00]]
5.匹配信息中某關(guān)鍵字并過(guò)濾帶標(biāo)簽的
// ` ` 是原生字符串
buf := `
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<title>Go語(yǔ)言標(biāo)準(zhǔn)庫(kù)文檔中文版 | Go語(yǔ)言中文網(wǎng) | Golang中文社區(qū) | Golang中國(guó)</title>
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1.0, user-scalable=no">
<meta http-equiv="X-UA-Compatible" content="IE=edge, chrome=1">
<meta charset="utf-8">
<link rel="shortcut icon" href="/static/img/go.ico" rel="external nofollow" >
<link rel="apple-touch-icon" type="image/png" href="/static/img/logo2.png" rel="external nofollow" >
<meta name="author" content="polaris <polaris@studygolang.com>">
<meta name="keywords" content="中文, 文檔, 標(biāo)準(zhǔn)庫(kù), Go語(yǔ)言,Golang,Go社區(qū),Go中文社區(qū),Golang中文社區(qū),Go語(yǔ)言社區(qū),Go語(yǔ)言學(xué)習(xí),學(xué)習(xí)Go語(yǔ)言,Go語(yǔ)言學(xué)習(xí)園地,Golang 中國(guó),Golang中國(guó),Golang China, Go語(yǔ)言論壇, Go語(yǔ)言中文網(wǎng)">
<meta name="description" content="Go語(yǔ)言文檔中文版,Go語(yǔ)言中文網(wǎng),中國(guó) Golang 社區(qū),Go語(yǔ)言學(xué)習(xí)園地,致力于構(gòu)建完善的 Golang 中文社區(qū),Go語(yǔ)言愛(ài)好者的學(xué)習(xí)家園。分享 Go 語(yǔ)言知識(shí),交流使用經(jīng)驗(yàn)">
</head>
<div>和愛(ài)好</div>
<div>哈哈
你在嗎
不在
</div>
<div>測(cè)試</div>
<div>你過(guò)來(lái)啊</div>
<frameset cols="15,85">
<frame src="/static/pkgdoc/i.html">
<frame name="main" src="/static/pkgdoc/main.html" tppabs="main.html" >
<noframes>
</noframes>
</frameset>
</html>
`
// 解釋正則表達(dá)式
reg := regexp.MustCompile(`<div>(?s:(.*?))</div>`) // s用來(lái)處理?yè)Q行情況
if reg == nil {
fmt.Println("MustCompile err")
return
}
// 提取關(guān)鍵字
res := reg.FindAllStringSubmatch(buf, -1)
// fmt.Println("res = ", res)
// 過(guò)濾<> </>
for _, text := range res {
//fmt.Println("text[0] = ", text[0]) // 帶<> </>的
fmt.Println("text[1] = ", text[1]) // 不帶<> </> 的
}
執(zhí)行結(jié)果:
text[1] = 和愛(ài)好
text[1] = 哈哈
你在嗎
不在
text[1] = 測(cè)試
text[1] = 你過(guò)來(lái)啊
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
go調(diào)用shell命令兩種方式實(shí)現(xiàn)(有無(wú)返回值)
本文主要介紹了go調(diào)用shell命令兩種方式實(shí)現(xiàn)(有無(wú)返回值),主要用于執(zhí)行shell命令,并且返回shell的標(biāo)準(zhǔn)輸出,具有一定的參考價(jià)值,感興趣的可以了解一下2021-12-12
Go存儲(chǔ)基礎(chǔ)使用direct io方法實(shí)例
這篇文章主要介紹了Go存儲(chǔ)基礎(chǔ)之如何使用direct io方法實(shí)例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-12-12
Go調(diào)度器學(xué)習(xí)之系統(tǒng)調(diào)用詳解
這篇文章腫,將以一個(gè)簡(jiǎn)單的文件打開的系統(tǒng)調(diào)用,來(lái)分析一下Go調(diào)度器在系統(tǒng)調(diào)用時(shí)做了什么。文中的示例代碼講解詳細(xì),需要的可以參考一下2023-04-04
Golang 函數(shù)執(zhí)行時(shí)間統(tǒng)計(jì)裝飾器的一個(gè)實(shí)現(xiàn)詳解
這篇文章主要介紹了Golang 函數(shù)執(zhí)行時(shí)間統(tǒng)計(jì)裝飾器的一個(gè)實(shí)現(xiàn)詳解,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-03-03
Go設(shè)計(jì)模式之狀態(tài)模式講解和代碼示例
狀態(tài)是一種行為設(shè)計(jì)模式,?讓你能在一個(gè)對(duì)象的內(nèi)部狀態(tài)變化時(shí)改變其行為,該模式將與狀態(tài)相關(guān)的行為抽取到獨(dú)立的狀態(tài)類中,?讓原對(duì)象將工作委派給這些類的實(shí)例,?而不是自行進(jìn)行處理,本文將通過(guò)代碼示例給大家簡(jiǎn)單的介紹一下Go狀態(tài)模式2023-08-08
GoLang協(xié)程庫(kù)libtask學(xué)習(xí)筆記
libtask一個(gè)C語(yǔ)言的協(xié)程庫(kù),是go語(yǔ)言的前身很早期的原型. 測(cè)試機(jī)器是我的mac air 安裝的centos虛擬機(jī)(只有一個(gè)核), 代碼沒(méi)有采用任何優(yōu)化,只是使用默認(rèn)配置2022-12-12

