python中文本字符處理的簡單方法記錄
今天,跟大家分享一下我做小項(xiàng)目時(shí)想出來的文本字符處理的方法,希望能對大家有所幫助。
完整代碼:
strings = "我,是‘C|S;D|N!的:程【序】員#M,r&.;P'a#n?_&學(xué)?狂"#將字符串設(shè)置好
def String_Process(string):#定義一個(gè)字符處理函數(shù),設(shè)置參數(shù)string,是有待處理的字符串。
print("python使我快樂??!")
print("未處理的字符串:",string)
varchar = '‘'“”:#,!【】,&#|?|,&;;?:"'#人為設(shè)定字符集合
ls = []#定義一個(gè)列表用于存儲(chǔ)拆散的字符
for s in string:
ls.append(s)#將字符串拆散存進(jìn)列表中
for element in ls:
if element in varchar:#如果在字符集合內(nèi)發(fā)現(xiàn),則從列表中刪除
ls.remove(element)
String = ''#定義字符串
for l in ls:#將列表中拆散的元素組合回去。
String = String+l
print("處理后的字符串:",String)#得到處理結(jié)果
String_Process(string=strings)#調(diào)用函數(shù),傳入實(shí)參給形參。
運(yùn)行結(jié)果,如下圖:

對于處理文本字符的思想在代碼中已經(jīng)說明,關(guān)于代碼的解釋在注釋中也寫出了。我們把它通過函數(shù)進(jìn)行封裝,當(dāng)我們需要處理文本字符的時(shí)候,通過調(diào)用函數(shù)就可以實(shí)現(xiàn)文本字符處理了。當(dāng)然,調(diào)用函數(shù)處理字符時(shí)需要得到string返回值以及注釋掉print,因?yàn)槲覀內(nèi)绻窃谘h(huán)中調(diào)用,沒必要全部打印一遍,影響視覺對文本的分析。即修改代碼如下圖:

對于上面的文本處理代碼,我又做了一次更新,可以增加新的字符或者是字符串來更新字符集合,更加方便處理文本中的字符。
改進(jìn)后的代碼,如下圖:
strings = "我,是‘C|S;D|N!的:程【序】員#M,r&.;②P'「(a#n」?_&學(xué)?狂..."#將字符串設(shè)置好
def Process(string):#定義一個(gè)字符處理函數(shù),設(shè)置參數(shù)string,是有待處理的字符串。
print("python使我快樂??!")
print("未處理的字符串:",string)
varchar = '‘'“”:#,!【】,&#|?|,&;;?:"'#人為設(shè)定字符集合
var_ls = []
for var in varchar:
var_ls.append(var)
print("這是當(dāng)前的字符集合:",var_ls)
while True:
want = str(input("是否需要增加新的字符/字符集合?(yes or no)"))
if want == 'yes':
add_varchar = str(input("請輸入需要增加的新字符/字符集合:"))
for var in add_varchar:
var_ls.append(var)
print("更新后的字符集合:",var_ls)
elif want == 'no':
break
else:
print("輸入有誤!!請重試!!")
continue
ls = []#定義一個(gè)列表用于存儲(chǔ)拆散的字符
for s in string:
ls.append(s)#將字符串拆散存進(jìn)列表中
for element in ls[:]:
if element in var_ls:#如果在字符集合內(nèi)發(fā)現(xiàn),則從列表中刪除
ls.remove(element)
elif element not in var_ls:
continue
String = ''#定義字符串
for l in ls:#將列表中拆散的元素組合回去。
String = String+l
print("處理后的字符串:",String)#得到處理結(jié)果
Process(string=strings)#調(diào)用函數(shù),傳入實(shí)參給形參。
代碼的解釋在注釋中寫了,大家如果對代碼不理解可以和我私信探討。
運(yùn)行結(jié)果,如下圖:

總結(jié)
到此這篇關(guān)于python中文本字符處理的文章就介紹到這了,更多相關(guān)python文本字符處理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
pycharm無法安裝第三方庫的問題及解決方法以scrapy為例(圖解)
這篇文章主要介紹了pycharm無法安裝第三方庫的解決辦法以scrapy為例,本文通過圖文并茂的形式給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-05-05
python實(shí)現(xiàn)三階魔方還原的示例代碼
這篇文章主要介紹了python實(shí)現(xiàn)三階魔方還原的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04
Python實(shí)現(xiàn)設(shè)計(jì)模式之單例模式詳解
這篇文章主要介紹了Python實(shí)現(xiàn)設(shè)計(jì)模式之單例模式詳解,設(shè)計(jì)模式是指軟件設(shè)計(jì)問題的推薦方案,設(shè)計(jì)模式一般是描述如何組織代碼和使用最佳實(shí)踐來解決常見的設(shè)計(jì)問題,需謹(jǐn)記一點(diǎn):設(shè)計(jì)模式是高層次的方案,并不關(guān)注具體的實(shí)現(xiàn)細(xì)節(jié),比如算法和數(shù)據(jù)結(jié)構(gòu),需要的朋友可以參考下2023-09-09
Selenium中免登錄的實(shí)現(xiàn)方法option詳解
在selenium中有很多種可以實(shí)現(xiàn)網(wǎng)站的免登錄,option就是其中的一種做法,這篇文章主要介紹了Selenium中免登錄的實(shí)現(xiàn)方法option,需要的朋友可以參考下2022-12-12
Python使用SciencePlots庫繪制學(xué)術(shù)圖表詳解
這篇文章主要介紹了Python使用SciencePlots庫繪制學(xué)術(shù)圖表,SciencePlots提供了一系列預(yù)設(shè)的科學(xué)繪圖樣式,能夠幫助研究人員輕松創(chuàng)建專業(yè)的學(xué)術(shù)圖表,需要的朋友可以參考下2025-04-04

