Python re模塊介紹
Python中轉(zhuǎn)義字符
正則表達(dá)式使用反斜杠” \ “來代表特殊形式或用作轉(zhuǎn)義字符,這里跟Python的語法沖突,因此,Python用” \\\\ “表示正則表達(dá)式中的” \ “,因為正則表達(dá)式中如果要匹配” \ “,需要用\來轉(zhuǎn)義,變成” \\ “,而Python語法中又需要對字符串中每一個\進(jìn)行轉(zhuǎn)義,所以就變成了” \\\\ “。
上面的寫法是不是覺得很麻煩,為了使正則表達(dá)式具有更好的可讀性,Python特別設(shè)計了原始字符串(raw string),需要提醒你的是,在寫文件路徑的時候就不要使用raw string了,這里存在陷阱。raw string就是用'r'作為字符串的前綴,如 r”\n”:表示兩個字符”\”和”n”,而不是換行符了。Python中寫正則表達(dá)式時推薦使用這種形式。
正則表達(dá)式元字符說明
. 匹配除換行符以外的任意字符
^ 匹配字符串的開始
$ 匹配字符串的結(jié)束
[] 用來匹配一個指定的字符類別
? 對于前一個字符字符重復(fù)0次到1次
* 對于前一個字符重復(fù)0次到無窮次
{} 對于前一個字符重復(fù)m次
{m,n} 對前一個字符重復(fù)為m到n次
\d 匹配數(shù)字,相當(dāng)于[0-9]
\D 匹配任何非數(shù)字字符,相當(dāng)于[^0-9]
\s 匹配任意的空白符,相當(dāng)于[ fv]
\S 匹配任何非空白字符,相當(dāng)于[^ fv]
\w 匹配任何字母數(shù)字字符,相當(dāng)于[a-zA-Z0-9_]
\W 匹配任何非字母數(shù)字字符,相當(dāng)于[^a-zA-Z0-9_]
\b 匹配單詞的開始或結(jié)束
模塊函數(shù)說明即舉例
re.compile 將正則表達(dá)式編譯成pattern對象
compile(pattern, flags=0)
第一個參數(shù):規(guī)則
第二個參數(shù):標(biāo)志位
re.match 只匹配字符串的開始,如果字符串開始不符合正則表達(dá)式,則匹配失敗,函數(shù)返回None
match(pattern, string, flags=0)
第一個參數(shù):規(guī)則
第二個參數(shù):表示要匹配的字符串
第三個參數(shù):標(biāo)致位,用于控制正則表達(dá)式的匹配方式
re.search 匹配整個字符串,直到找到一個匹配
search(pattern, string, flags=0)
第一個參數(shù):規(guī)則
第二個參數(shù):表示要匹配的字符串
第三個參數(shù):標(biāo)致位,用于控制正則表達(dá)式的匹配方式
>>> import re
>>> pattern = re.compile(r'linuxeye')
>>> match = pattern.match('jb51.net')
>>> print match
<_sre.SRE_Match object at 0x7f4e96e61c60>
>>> print match.group()
linuxeye
>>> m = pattern.match('blog.jb51.net') #match匹配開頭,沒找到
>>> print m
None
>>> m = pattern.search('blog.jb51.net') #search匹配整個字符串,直到找到一個匹配
>>> print m
<_sre.SRE_Match object at 0x7f15abfc6b28>
>>> print m.group()
linuxeye
>>> m = re.match(r'linuxeye','jb51.net') #不用re.compile >>> print m <_sre.SRE_Match object at 0x7f4e96e61b90> >>> print m.group() linuxeye >>> m = re.match(r'linuxeye','www.dhdzp.com') >>> print m None
re.split 用于來分割字符串
split(pattern, string, maxsplit=0)
第一個參數(shù):規(guī)則
第二個參數(shù):字符串
第三個參數(shù):最大分割字符串,默認(rèn)為0,表示每個匹配項都分割
實(shí)例:分割所有的字符串
>>> import re >>> test_str = "1 2 3 4 5" >>> re.split(r'\s+',test_str) ['1', '2', '3', '4', '5'] >>> re.split(r'\s+',test_str,2) #分割前2個 ['1', '2', '3 4 5'] >>> test_str = "1 . 2. 3 .4 . 5" >>> re.split(r'\.',test_str) ['1 ', ' 2', ' 3 ', '4 ', ' 5'] >>> re.split(r'\.',test_str,3) ['1 ', ' 2', ' 3 ', '4 . 5']
re.findall 在目標(biāo)字符串查找符合規(guī)則的字符串
findall(pattern, string, flags=0)
第一個參數(shù):規(guī)則
第二個參數(shù):目標(biāo)字符串
但三個參數(shù):后面還可以跟一個規(guī)則選擇項
返回的結(jié)果是一個列表,建中存放的是符合規(guī)則的字符串,如果沒有符合規(guī)則的字符串唄找到,就會返回一個空值
>>> import re
>>> test_mail = '<test01@gmail.com> <test02@gmail.org> test03@gmail.net'
>>> mail_re = re.compile(r'\w+@g....\.[a-z]{3}')
>>> re.findall(mail_re,test_mail)
['test01@gmail.com', 'test02@gmail.org', 'test03@gmail.net']
re.sub 以正則表達(dá)式為基礎(chǔ)的替換工作
sub(pattern, repl, string, count=0)
第一個參數(shù):規(guī)則
第二個參數(shù):替換后的字符串
第三個參數(shù):字符串
第四個參數(shù):替換個數(shù)。默認(rèn)為0,表示每個匹配項都替換
>>> test = 'blog.jb51.net jb51.net' >>> test_re = re.compile(r'\.') >>> re.sub(test_re,'--',test) 'blog--linuxeye--com linuxeye--com' >>> re.sub(test_re,'--',test,1) 'blog--jb51.net jb51.net'
相關(guān)文章
Python中動態(tài)創(chuàng)建類實(shí)例的方法
在Java中我們可以通過反射來根據(jù)類名創(chuàng)建類實(shí)例,那么在Python我們怎么實(shí)現(xiàn)類似功能呢?其實(shí)在Python有一個builtin函數(shù)import,我們可以使用這個函數(shù)來在運(yùn)行時動態(tài)加載一些模塊2017-03-03
Python開發(fā)生產(chǎn)環(huán)境常用的4個工具(實(shí)用推薦)
構(gòu)建優(yōu)秀的軟件需要遵循特定的規(guī)則并執(zhí)行行業(yè)標(biāo)準(zhǔn),如何在真實(shí)的生產(chǎn)環(huán)境開發(fā)中體現(xiàn)呢?在這篇文章中,我將向您展示我在Python項目中設(shè)置的4種工具,以簡化開發(fā)工作流程并執(zhí)行一些最佳實(shí)踐,這些工具幫助我提高了效率,節(jié)省了時間,希望你讀完也能有所收獲2024-01-01
python3利用venv配置虛擬環(huán)境及過程中的小問題小結(jié)
這篇文章主要介紹了python3利用venv配置虛擬環(huán)境及過程中的小問題小結(jié),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-08-08
python?實(shí)現(xiàn)syslog?服務(wù)器的詳細(xì)過程
這篇文章主要介紹了python?實(shí)現(xiàn)syslog服務(wù)器的詳細(xì)過程,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-08-08
Python基于wordcloud及jieba實(shí)現(xiàn)中國地圖詞云圖
這篇文章主要介紹了Python基于wordcloud及jieba實(shí)現(xiàn)中國地圖詞云圖,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-06-06
Python pyecharts實(shí)現(xiàn)繪制中國地圖的實(shí)例詳解
pyecharts是一個用于生成 Echarts 圖表的類庫。Echarts 是百度開源的一個數(shù)據(jù)可視化 JS 庫。用 Echarts 生成的圖可視化效果非常棒。本文將通過pyecharts繪制中國地圖,需要的可以學(xué)習(xí)一下2022-01-01

