python刪除文本中行數(shù)標(biāo)簽的方法
問題描述:
我們在網(wǎng)上下載或者復(fù)制別人代碼的時(shí)候經(jīng)常會(huì)遇到下載的代碼中包含行數(shù)標(biāo)簽的情況。如下圖:

這些代碼中包含著行數(shù)如1.,2.等,如果我們想直接運(yùn)行或者copy代碼需要自己手動(dòng)的刪除這些標(biāo)簽。既然學(xué)了python,我們寫一段腳本來處理它吧。
思路分析:
首先,我們逐行的讀取文本。
利用正則表達(dá)式,可以順利地匹配出所有的這些標(biāo)簽以及后面跟隨的“\t”,正則表達(dá)式為:“\d+.\t”。
接著我們將匹配的結(jié)果在這一行中刪除它,使用string模塊的replace方法,將匹配的結(jié)果用‘'代替。
最后,我們保存每次刪除了行數(shù)標(biāo)簽的結(jié)果行,然后將這些行寫入原文本。注意,以w的方式打開文本會(huì)刪除原文本內(nèi)容。
代碼:
# -*- coding:utf-8 -*-
import re
import os
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
ls = os.linesep
label_regex = r'\d+.\t'
content = []
for line in open('source.txt', 'r'):
mm = re.search(label_regex, line)
if mm:
mm = mm.group()
content.append(line.replace(mm, '').rstrip())
else:
break
f = open('source.txt', 'w')
f.writelines(['%s%s' % (x,ls) for x in content])
結(jié)果:

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
簡單且有用的Python數(shù)據(jù)分析和機(jī)器學(xué)習(xí)代碼
Python編程是一種通用的編程語言,開源、靈活、功能強(qiáng)大且易于使用,python最重要的特性之一是其用于數(shù)據(jù)處理和分析任務(wù)的豐富實(shí)用程序和庫集,這篇文章主要給大家介紹了一些簡單且有用的Python數(shù)據(jù)分析和機(jī)器學(xué)習(xí)代碼,需要的朋友可以參考下2021-07-07
pycharm轉(zhuǎn)移緩存目錄的實(shí)現(xiàn)
Pycharm在使用過程中,Pycharm會(huì)生成大量緩存文件,而這些緩存文件默認(rèn)存儲(chǔ)在C盤的用戶目錄里面,導(dǎo)致C盤空間被占用,本文主要介紹了pycharm轉(zhuǎn)移緩存目錄,感興趣的可以了解一下2023-10-10
關(guān)于python3?opencv?圖像二值化的問題(cv2.adaptiveThreshold函數(shù))
這篇文章主要介紹了python3?opencv?圖像二值化cv2.adaptiveThreshold函數(shù)的相關(guān)知識(shí),結(jié)合示例代碼介紹了adaptiveThreshold方法的用法,需要的朋友可以參考下2022-04-04
python飛機(jī)大戰(zhàn) pygame游戲創(chuàng)建快速入門詳解
這篇文章主要介紹了python飛機(jī)大戰(zhàn) pygame游戲創(chuàng)建,結(jié)合實(shí)例形式詳細(xì)分析了Python使用pygame創(chuàng)建飛機(jī)大戰(zhàn)游戲的具體步驟與相關(guān)操作注意事項(xiàng),需要的朋友可以參考下2019-12-12
Python3.10?Generator生成器Coroutine原生協(xié)程詳解
這篇文章主要為大家介紹了Python3.10?Generator生成器Coroutine原生協(xié)程詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-12-12
python切片中內(nèi)存的注意事項(xiàng)總結(jié)
在本篇文章里小編給大家整理的是一篇關(guān)于python切片中內(nèi)存的注意事項(xiàng)總結(jié)內(nèi)容,有需要的朋友們可以學(xué)習(xí)參考下。2021-08-08

