Python實現(xiàn)簡單文本字符串處理的方法

更新時間：2018年01月22日 10:21:26 作者：Lovephysics

這篇文章主要介紹了Python實現(xiàn)簡單文本字符串處理的方法,涉及Python針對文本字符串的切割、計算、轉換等相關操作技巧,需要的朋友可以參考下

本文實例講述了Python實現(xiàn)簡單文本字符串處理的方法。分享給大家供大家參考，具體如下：

對于一個文本字符串，可以使用Python的string.split()方法將其切割。下面看看實際運行效果。

mySent = 'This book is the best book on python!'
print mySent.split()

輸出：

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python!']

可以看到，切分的效果不錯，但是標點符號也被當成了詞，可以使用正則表達式來處理，其中分隔符是除單詞、數(shù)字外的任意字符串。

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
print listof

輸出為：

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python', '']

現(xiàn)在得到了一系列詞組成的詞表，但是里面的空字符串需要去掉。

可以計算每個字符串的長度，只返回大于0的字符串。

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
new_list = [tok for tok in listof if len(tok)>0]
print new_list

輸出為：

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python']

最后，發(fā)現(xiàn)句子中的第一個字母是大寫的。我們需要同一形式，把大寫轉化為小寫。Python內嵌的方法，可以將字符串全部轉化為小寫(.lower())或大寫(.upper())

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
new_list = [tok.lower() for tok in listof if len(tok)>0]
print new_list

輸出為：

['this', 'book', 'is', 'the', 'best', 'book', 'on', 'python']

下面來看一封完整的電子郵件：

內容

Hi Peter,

With Jose out of town, do you want to
meet once in a while to keep things
going and do some interesting stuff?

Let me know
Eugene

import re
reg = re.compile('\\W*')
email = open('email.txt').read()
list = reg.split(email)
new_txt = [tok.lower() for tok in list if len(tok)>0]
print new_txt

輸出：

復制代碼代碼如下:

['hi', 'peter', 'with', 'jose', 'out', 'of', 'town', 'do', 'you', 'want', 'to', 'meet', 'once', 'in', 'a', 'while', 'to', 'keep', 'things', 'going', 'and', 'do', 'some', 'interesting', 'stuff', 'let', 'me', 'know', 'eugene']

更多關于Python相關內容可查看本站專題：《Python字符串操作技巧匯總》、《Python數(shù)據(jù)結構與算法教程》、《Python函數(shù)使用技巧總結》、《Python入門與進階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》

希望本文所述對大家Python程序設計有所幫助。

您可能感興趣的文章:

python 如何通過執(zhí)行腳本安裝庫或卸載庫
通過執(zhí)行Python腳本,用戶可以輕松地安裝或卸載所需的庫,本文介紹了該過程的具體步驟,包括如何編寫用于安裝或卸載庫的腳本,無論是需要添加新功能還是清理環(huán)境,通過這種方式,開發(fā)者都能有效管理其工作環(huán)境中的庫
2024-11-11
python3獲取url文件大小示例代碼
這篇文章主要介紹了python3獲取url文件大小,本文通過示例代碼給大家介紹的非常詳細，具有一定的參考借鑒價值，需要的朋友可以參考下
2019-09-09
pycharm?終端部啟用虛擬環(huán)境詳情
這篇文章主要介紹了pycharm?終端部啟用虛擬環(huán)境詳情，文章圍繞pycharm?終端部啟用虛擬環(huán)境商務相關資料展開全文章的詳細內容，需要的小伙伴可以參考一下
2021-12-12
Python全棧之線程詳解
這篇文章主要為大家介紹了Python全棧之線程，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2021-12-12
python保留小數(shù)函數(shù)的幾種使用總結
本文主要介紹了python保留小數(shù)函數(shù)的幾種使用總結，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2023-02-02
如何在mac下配置python虛擬環(huán)境
這篇文章主要介紹了如何mac下配置python虛擬環(huán)境,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-07-07
詳解Python如何通過文件后綴整理文件夾
這篇文章主要為大家詳細介紹了Python如何通過文件后綴實現(xiàn)整理文件夾功能,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學習一下
2024-02-02
Python?return函數(shù)返回值類型和幫助函數(shù)使用教程
這篇文章主要為大家介紹了Python?return函數(shù)返回值類型和幫助函數(shù)使用教程詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-06-06
Python如何生成隨機高斯模糊圖片詳解
這篇文章主要給大家介紹了關于高斯模糊的原理以及python實現(xiàn)的相關資料，Python使用opencv庫生成模糊圖像還是很方便的，需要的朋友可以參考下
2021-05-05
Python腳本實現(xiàn)自動刪除C盤臨時文件夾
在日常使用電腦的過程中,臨時文件夾往往會積累大量的無用數(shù)據(jù),占用寶貴的磁盤空間,下面我們就來看看Python如何通過腳本實現(xiàn)自動刪除C盤臨時文件夾吧
2025-01-01