Python?如何截取字符函數(shù)
如何截取字符函數(shù)
在工作中我們經(jīng)常會(huì)遇到某種情況需要截取字符串中某個(gè)特定標(biāo)簽之間的內(nèi)容(爬蟲可能用到的較多),適用于很多情況例如字符串形式的xml報(bào)文、json格式的字符串以及其它類型的字符串。
因?yàn)槲铱偨Y(jié)了有關(guān)字符串截取的兩個(gè)函數(shù)來記錄一下,以供參考。
# 方法一:簡(jiǎn)單截取不重復(fù)標(biāo)簽中的內(nèi)容 def substr(mystr, startStr, endChar): ? ? ''' ? ? 自定義字符串截取函數(shù):只從字符串中第一次遇見的內(nèi)容 ? ? ''' ? ? startStr_len = len(startStr) ? ? start_index = mystr.index(startStr) ? ? end_index = mystr.index(endChar) ? ? return mystr[start_index+startStr_len:end_index] ? ''' a = 'abc111bcd abc222bcd' result = substr(a, 'abc', 'bcd') ? ?# result='111' ''' ? # 方法二:重復(fù)截取標(biāo)簽中的內(nèi)容并將結(jié)果作為列表返回 def substr_to_list(mystr, startStr, endChar): ? ? '''自定義字符串截取函數(shù)''' ? ? result = [] ? ? position = 0 ? ? while True: ? ? ? ? ? ? ? ?# 因?yàn)閕ndex()函數(shù)如果沒有找到想要的內(nèi)容會(huì)報(bào)異常ValueError ? ? ? ? try: ? ? ? ? ? ? ? ? ? ? ? ? startStr_len = len(startStr) ? ? ? ? ? ? endChar_len = len(endChar) ? ? ? ? ? ? start_index = mystr.index(startStr, position) ? ? ? ? ? ? end_index = mystr.index(endChar, position) ? ? ? ? ? ? position = end_index + endChar_len ? ? ? ? ? ? result.append(mystr[start_index+startStr_len:end_index]) ? ? ? ? except Exception as e: ? ? ? ? ? ? break ? ? return result ''' a = 'abc111bcd abc222bcd' result = substr(a, 'abc', 'bcd') ? ?# result=['111','222'] '''
效率方面就沒有考慮啦,畢竟都用python了還考慮什么效率,哈哈!
截取字符串(字符串切片)
字符串
從本質(zhì)上講,字符串是由多個(gè)字符構(gòu)成的,字符之間是有順序的,這個(gè)順序號(hào)就稱為索引(index)。Python 允許通過索引來操作字符串中的單個(gè)或者多個(gè)字符,比如獲取指定索引處的字符,返回指定字符的索引值等。
獲取單個(gè)字符
知道字符串名字以后,在方括號(hào)[ ]中使用索引即可訪問對(duì)應(yīng)的字符,具體的語法格式為:
strname[index]
strname 表示字符串名字,index 表示索引值。
Python 允許從字符串的兩端使用索引:
- 當(dāng)以字符串的左端(字符串的開頭)為起點(diǎn)時(shí),索引是從 0 開始計(jì)數(shù)的;字符串的第一個(gè)字符的索引為 0,第二個(gè)字符的索引為 1,第三個(gè)字符串的索引為 2 ……
- 當(dāng)以字符串的右端(字符串的末尾)為起點(diǎn)時(shí),索引是從 -1 開始計(jì)數(shù)的;字符串的倒數(shù)第一個(gè)字符的索引為 -1,倒數(shù)第二個(gè)字符的索引為 -2,倒數(shù)第三個(gè)字符的索引為 -3 ……
請(qǐng)看下面的實(shí)例演示:
url = 'http://c.biancheng.net/python/' #獲取索引為10的字符 print(url[10]) #獲取索引為 6 的字符 print(url[-6])
運(yùn)行結(jié)果:
i
y
獲取多個(gè)字符(字符串截去/字符串切片)
使用[ ]除了可以獲取單個(gè)字符外,還可以指定一個(gè)范圍來獲取多個(gè)字符,也就是一個(gè)子串或者片段,具體格式為:
strname[start : end : step]
對(duì)各個(gè)部分的說明:
strname:要截取的字符串;start:表示要截取的第一個(gè)字符所在的索引(截取時(shí)包含該字符)。如果不指定,默認(rèn)為 0,也就是從字符串的開頭截??;end:表示要截取的最后一個(gè)字符所在的索引(截取時(shí)不包含該字符)。如果不指定,默認(rèn)為字符串的長(zhǎng)度;step:指的是從 start 索引處的字符開始,每 step 個(gè)距離獲取一個(gè)字符,直至 end 索引出的字符。step 默認(rèn)值為 1,當(dāng)省略該值時(shí),最后一個(gè)冒號(hào)也可以省略。
【實(shí)例1】基本用法:
url = 'http://c.biancheng.net/java/' #獲取索引從7處到22(不包含22)的子串 print(url[7: 22]) # 輸出 zy #獲取索引從7處到-6的子串 print(url[7: -6]) # 輸出 zyit.org is very #獲取索引從-21到6的子串 print(url[-21: -6]) #從索引3開始,每隔4個(gè)字符取出一個(gè)字符,直到索引22為止 print(url[3: 22: 4])
運(yùn)行結(jié)果:
c.biancheng.net
c.biancheng.net
c.biancheng.net
pcaen
【實(shí)例2】高級(jí)用法,start、end、step 三個(gè)參數(shù)都可以省略:
url = 'http://c.biancheng.net/java/' #獲取從索引5開始,直到末尾的子串 print(url[7: ]) #獲取從索引-21開始,直到末尾的子串 print(url[-21: ]) #從開頭截取字符串,直到索引22為止 print(url[: 22]) #每隔3個(gè)字符取出一個(gè)字符 print(url[:: 3])
運(yùn)行結(jié)果:
c.biancheng.net/java/
c.biancheng.net/java/
http://c.biancheng.net
hp/bne.ta/
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python利用dir函數(shù)查看類中所有成員函數(shù)示例代碼
這篇文章主要給大家介紹了關(guān)于python如何利用dir函數(shù)查看類中所有成員函數(shù)的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)下吧。2017-09-09
python之隨機(jī)數(shù)函數(shù)的實(shí)現(xiàn)示例
這篇文章主要介紹了python之隨機(jī)數(shù)函數(shù)的實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12
Python實(shí)現(xiàn)創(chuàng)建模塊的方法詳解
導(dǎo)入一個(gè)模塊,我們一般都會(huì)使用?import?關(guān)鍵字,但有些場(chǎng)景下?import?難以滿足我們的需要。所以除了?import?之外還有很多其它導(dǎo)入模塊的方式,下面就來介紹一下2022-07-07
淺談Python 多進(jìn)程默認(rèn)不能共享全局變量的問題
今天小編就為大家分享一篇淺談Python 多進(jìn)程默認(rèn)不能共享全局變量的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-01-01
python eval 轉(zhuǎn)換k m到乘法計(jì)算的操作
這篇文章主要介紹了python eval 轉(zhuǎn)換k m到乘法計(jì)算的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05
python腳本之如何按照清晰度對(duì)圖片進(jìn)行分類
這篇文章主要介紹了python腳本之如何按照清晰度對(duì)圖片進(jìn)行分類問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05
用python實(shí)現(xiàn)讀取xlsx表格操作
大家好,本篇文章主要講的是用python實(shí)現(xiàn)讀取xlsx表格操作,感興趣的同學(xué)趕快來看一看吧,對(duì)你有幫助的話記得收藏一下2022-01-01

