Python 讀取某個目錄下所有的文件實例

更新時間：2018年06月23日 15:12:16 作者：嘎里給給

今天小編就為大家分享一篇Python 讀取某個目錄下所有的文件實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

在處理數(shù)據(jù)的時候，因為沒有及時的去重，所以需要重新對生成txt進行去重。

可是一個文件夾下有很多txt，總不可能一個一個去操作，這樣效率太低了。這里我們需要用到 os 這個包

關(guān)鍵的代碼

<span style="font-size:14px;"># coding=utf-8
#出現(xiàn)了中文亂碼的問題，于是我無腦utf-8 。希望后期的學(xué)習(xí)可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')

#這里放著你要操作的文件夾名稱
path = 'E:\\get_key\\'

#把e:\get_key\目錄下的文件名全部獲取保存在files中
files = os.listdir(path.decode('utf-8'))

#用set可以很好的去重，在數(shù)據(jù)處理的時候經(jīng)常會被使用到。這里做初始化
datas = set()

for file in files :
 #準(zhǔn)確獲取一個txt的位置，利用字符串的拼接
 txt_path = 'E:\\get_key\\'+file.decode('utf-8')
 #把結(jié)果保存了在contents中
 contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')
 
 #datas的數(shù)據(jù)清空 
 datas.clear()
 
 #把數(shù)據(jù)add到datas中，可以去重
 for content in contents:
  print(content.decode('utf-8'))
  datas.add(content.decode('utf-8'))

 #去重后新的文件保存的路徑
 new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
 unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')

 #把datas里的數(shù)據(jù)輸出到新生成的txt中
 for data in datas:
  unique_keywords.write(data+"\n")

 #釋放資源
 unique_keywords.close()</span>

以上這篇Python 讀取某個目錄下所有的文件實例就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

Python反射和內(nèi)置方法重寫操作詳解
這篇文章主要介紹了Python反射和內(nèi)置方法重寫,結(jié)合實例形式較為詳細(xì)的分析了Python反射概念、原理及內(nèi)置方法重寫相關(guān)操作技巧與注意事項,需要的朋友可以參考下
2018-08-08
Python中turtle庫的使用實例
這篇文章主要介紹了Python中turtle庫的使用實例,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2019-09-09
python django生成遷移文件的實例
今天小編就為大家分享一篇python django生成遷移文件的實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-08-08
python迭代器,生成器詳解
這篇文章主要介紹了Python中的迭代器和生成器,涉及到Python中很多重要的特性,小編覺得這篇文章寫的還不錯，需要的朋友可以參考下
2021-10-10
淺談Python中文件夾和python package包的區(qū)別
這篇文章主要介紹了淺談Python中文件夾和python package包的區(qū)別，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-06-06
Python實現(xiàn)線程池代碼分享
這篇文章主要介紹了Python實現(xiàn)線程池代碼分享,本文直接給出實例代碼,需要的朋友可以參考下
2015-06-06
利用pytorch實現(xiàn)對CIFAR-10數(shù)據(jù)集的分類
今天小編就為大家分享一篇利用pytorch實現(xiàn)對CIFAR-10數(shù)據(jù)集的分類，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-01-01
python中flatten()參數(shù)示例詳解
flatten是numpy.ndarray.flatten的一個函數(shù),即返回一個一維數(shù)組,這篇文章主要給大家介紹了關(guān)于python中flatten()參數(shù)的相關(guān)資料,文中通過實例代碼介紹的非常詳細(xì),需要的朋友可以參考下
2022-03-03
Python反射操作對象屬性方法詳解
這篇文章主要介紹了Python反射操作對象屬性方法詳解,在Python面對對象中，通過字符串的形式去操作對象的屬性方法就稱之為反射(在Python中一切事物都是可以為對象),需要的朋友可以參考下
2023-08-08
NumPy迭代數(shù)組的實現(xiàn)
本文主要介紹了NumPy迭代數(shù)組的實現(xiàn)，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2023-02-02