Python實(shí)現(xiàn)文本文件拆分寫入到多個文本文件的方法
引言
將一個txt文本文件中的內(nèi)容行拆分固定的行數(shù),自動分批寫入到多個文本文件。
比如:一個源txt文件有5100行數(shù)據(jù),每1000行插入到一個txt文件,最后獲得6個txt文件(5個文本文件有1000行數(shù)據(jù),第6個文本文件有100行數(shù)據(jù))。
步驟
1、先建立一個目錄用于存放分割后的txt文件(這里的目錄名為:dataText)
2、修改拆分的數(shù)目(這里是每5000行數(shù)據(jù)存入一個txt文件)
3、運(yùn)行python文件,查看生成的txt文件
代碼
open_diff = open('data.txt', 'r') # 源文本文件
diff_line = open_diff.readlines()
line_list = []
for line in diff_line:
line_list.append(line)
count = len(line_list) # 文件行數(shù)
print('源文件數(shù)據(jù)行數(shù):',count)
# 切分diff
diff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每個文件的數(shù)據(jù)行數(shù)
# 將切分的寫入多個txt中
for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 寫入txt,計(jì)算需要寫入的文件數(shù)
with open('./dataText/ImageData%d.txt'% j,'w+') as temp:
for line in diff_match_split[i]:
temp.write(line)
print('拆分后文件的個數(shù):',i+1)
結(jié)果


應(yīng)用:
將txt文件中的數(shù)據(jù)拆分成多個文本文件,可以解決由于文本文件數(shù)據(jù)過大而無法導(dǎo)入某些軟件的問。
這里是將一個url文本文件(約15M)導(dǎo)入idm下載url中的內(nèi)容,但由于文本文件過大,數(shù)據(jù)量過多,就拆分成多個文本文件分批次導(dǎo)入idm。
注意:
1、程序中的5000為寫入每個文件的數(shù)據(jù)行數(shù),最后一個文件的行數(shù)不足5000,也用一個文本文件存儲。
2、根據(jù)需要,修改存儲數(shù)據(jù)的行數(shù)(兩個地方的5000都需要修改)。
到此這篇關(guān)于Python實(shí)現(xiàn)文本文件拆分寫入到多個文本文件的方法的文章就介紹到這了,更多相關(guān)Python 文本文件拆分內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python中OpenCV實(shí)現(xiàn)簡單車牌字符切割
本文將結(jié)合實(shí)例代碼,在Jupyter Notebook上使用Python+opencv實(shí)現(xiàn)如下簡單車牌字符切割。感興趣的小伙伴可以參考一下2021-06-06
numpy工程實(shí)踐之np.savetxt()存儲數(shù)據(jù)
NumPy提供了多種存取數(shù)組內(nèi)容的文件操作函數(shù),保存數(shù)組數(shù)據(jù)的文件可以是二進(jìn)制格式或者文本格式,下面這篇文章主要給大家介紹了關(guān)于numpy工程實(shí)踐之np.savetxt()存儲數(shù)據(jù)的相關(guān)資料,需要的朋友可以參考下2023-05-05
用Python簡單實(shí)現(xiàn)個貪吃蛇小游戲(保姆級教程)
本文基于Windows環(huán)境開發(fā),適合Python新手,文中有非常詳細(xì)的代碼示例,對正在學(xué)習(xí)python的小伙伴們很有幫助,需要的朋友可以參考下2021-06-06
Python運(yùn)算符的應(yīng)用超全面詳細(xì)教程
Python運(yùn)算符是為了實(shí)現(xiàn)數(shù)值或字符運(yùn)算的特殊符號。Python運(yùn)算符可以分為算術(shù)運(yùn)算符、邏輯運(yùn)算符、賦值運(yùn)算符、成員運(yùn)算符、身份運(yùn)算符、比較運(yùn)算符、三目運(yùn)算符等。接下來,我們就開始來學(xué)習(xí)這一堆符號吧2022-07-07
Python socket模塊方法實(shí)現(xiàn)詳解
這篇文章主要介紹了Python socket模塊方法實(shí)現(xiàn)詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-11-11
詳談套接字中SO_REUSEPORT和SO_REUSEADDR的區(qū)別
下面小編就為大家分享一篇詳談套接字中SO_REUSEPORT和SO_REUSEADDR的區(qū)別,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-04-04
Request的中斷和ErrorHandler實(shí)例解析
這篇文章主要介紹了Request的中斷和ErrorHandler實(shí)例解析,分享了相關(guān)代碼示例,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下2018-02-02
Python中等待5秒并暫停執(zhí)行的方法總結(jié)
Python 具有各種功能和庫來創(chuàng)建交互式應(yīng)用程序,用戶可以在其中提供輸入和響應(yīng), 我們可以創(chuàng)建需要暫停應(yīng)用程序執(zhí)行的情況,本文主要和大家分享三個Python 中等待 5 秒并暫停執(zhí)行的方法,有需要的可以參考下2023-10-10

