Python實現(xiàn)從文件中加載數(shù)據(jù)的方法詳解
前幾篇都是手動錄入或隨機函數(shù)產(chǎn)生的數(shù)據(jù)。實際有許多類型的文件,以及許多方法,用它們從文件中提取數(shù)據(jù)來圖形化。
比如之前python基礎(chǔ)(12)介紹打開文件的方式,可直接讀取文件中的數(shù)據(jù),擴大了我們的數(shù)據(jù)來源。下面,將展示幾種方法。
我們將使用內(nèi)置的 csv 模塊加載CSV文件
CSV文件是一種特殊的文本文件,文件中的數(shù)據(jù)以逗號作為分隔符,很適合進行數(shù)據(jù)的解析。先用excle建立如下表格和數(shù)據(jù),另存為csv格式文件,放到代碼目錄下。

包含在Python標(biāo)準(zhǔn)庫中自帶CSV 模塊,我們只需要import進來就能使用。比如我們需要將上面的CSV文件都打印出來,代碼 如下:
import csv #import csv 用來導(dǎo)入csv模塊
filename = 'E:\WorkSpace\python\coding\score.csv' #文件保存的絕對路徑
with open(filename) as file_csv: #是不是忘記了如何打開文件?打開文件,并將結(jié)果文件對象存儲在file_csv中
reader = csv.reader(file_csv) #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容
for row in reader: # 用for循環(huán)打印每一行
print(row)運行結(jié)果如下:
['Name', 'Grade', 'Class', 'Age', 'mathscore', 'Englishscore']
['Lucy', '7', '2', '14', '95', '86']
['bush', '8', '1', '15', '80', '75']
['lily', '7', '3', '14', '93', '95']
['Jack', '8', '2', '14', '87', '84']
['Mary', '9', '1', '15', '85', '86']
['philip', '7', '3', '14', '90', '92']
['Liming', '9', '2', '16', '99', '87']
打印文件頭及其位置
讀入文件,是為了獲取其中的數(shù)據(jù),需要將相關(guān)信息進行分離,先看看如何讀出頭即文件的第一行, next()返回文件中的下一行。
import csv #import csv 用來導(dǎo)入csv模塊
filename = 'E:\WorkSpace\python\coding\score.csv' #文件保存的絕對路徑
with open(filename) as file_csv: #是不是忘記了如何打開文件?打開文件,并將結(jié)果文件對象存儲在file_csv中
reader = csv.reader(file_csv) #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容
header_row = next(reader) #模塊csv包含函數(shù) next() ,調(diào)用它并將閱讀器對象傳遞給它時,它將返回文件中的下一行。
#調(diào)用了next()一次,因此得到的是文件的第一行,其中包含文件頭
? ? ? #for row in reader: # 用for循環(huán)打印每一行? ? ? # print(row)
for index, column_header in enumerate(header_row): #對列表調(diào)用了enumerate()來獲取每個元素的索引及其值
print(index, column_header)運行后的結(jié)果如下所示:
0 Name
1 Grade
2 Class
3 Age
4 mathscore
5 Englishscore
提取其中索引,即name的索引為0,Grade的索引為1,知道了索引便可以讀取其中的任何數(shù)據(jù),比如我們要打印出mathscore,索引為4,于是代碼如下:
scores =[] 定義一個空的list
for row in reader:
scores.append(int(row[4])) #讀取的文件,默認(rèn)為字符串,用int()轉(zhuǎn)換為數(shù)字。
print(scores)運行結(jié)果:
[95, 80, 93, 87, 85, 90, 99]
接下來,制作圖表展示一下,先把mathscore和englishscore分?jǐn)?shù)做個柱狀對比。代碼如下:
import matplotlib.pyplot as plt
import csv #import csv 用來導(dǎo)入csv模塊
filename = 'E:\WorkSpace\python\coding\score.csv' #文件保存的絕對路徑
with open(filename) as file_csv: #是不是忘記了如何打開文件?打開文件,并將結(jié)果文件對象存儲在file_csv中
reader = csv.reader(file_csv) #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容
header_row = next(reader) #模塊csv包含函數(shù) next() ,調(diào)用它并將閱讀器對象傳遞給它時,它將返回文件中的下一行。
#調(diào)用了 next() 一次,因此得到的是文件的第一行,其中包含文件頭
mathscores =[] #定義兩個列表
englishscores=[]
for row in reader:
mathscores.append(int(row[4])) #讀取索引為4的數(shù)據(jù),默認(rèn)為字符串,用int()轉(zhuǎn)換為數(shù)字。
englishscores.append(int(row[5])) #讀取索引為5的數(shù)據(jù),用int()轉(zhuǎn)換為數(shù)字。
plt.bar([1,3,5,7,9,11,13],mathscores,label='math',color='#FF2204')
plt.bar([2,4,6,8,10,12,14],englishscores, label='englis', color='g')
plt.legend()
plt.title('scores')
plt.show()已將那些打印相關(guān)代碼刪除??催\行結(jié)果:

接下來,我們讀取文件 ,并根據(jù)文件中的時間來繪制圖表
新建一個年份的數(shù)據(jù)(真的是胡編亂造的數(shù)據(jù)),第一列是年份,第二列每年畢業(yè)的人數(shù),第三列是每年申請人數(shù),如圖所示:

要求:
1,按年份分別顯示出每年兩者的人數(shù),并用不同的顏色表示;
2、兩者間也用其他顏色進行填充。
完成代碼如下:
import matplotlib.pyplot as plt
import csv #import csv 用來導(dǎo)入csv模塊
from datetime import datetime #引入時間相關(guān)模塊
filename = 'E:\WorkSpace\python\coding\graduatesNumbers.csv' #文件保存的絕對路徑
with open(filename) as file_csv: #是不是忘記了如何打開文件?打開文件,并將結(jié)果文件對象存儲在file_csv中
reader = csv.reader(file_csv) #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容
header_row = next(reader)
dates=[]
numbers=[]
application_numbers=[]
for row in reader:
current_date = datetime.strptime(row[0], "%Y/%m/%d") #年份,strptime()日期格式轉(zhuǎn)化為字符串格式的函數(shù)
dates.append(current_date)
numbers.append(int(row[1])) #讀取索引為1的數(shù)據(jù),默認(rèn)為字符串,用int()轉(zhuǎn)換為數(shù)字,即Numbers of graduates 。
application_numbers.append(int(row[2])) #讀取索引為2的數(shù)據(jù),即Number of applicants
plt.plot(dates,numbers,label='Numbers of graduate', c='red') #顯示第一條線
plt.plot(dates,application_numbers,label='Number of applicant', c='green') #顯示第二條線application_numbers折線
plt.fill_between(dates,numbers, application_numbers, facecolor='blue', alpha=0.5) #在兩線之間填充顏色 alpha透明度
plt.title("The numbers of graduate",fontsize=24)
plt.xlabel('Years', fontsize=16)
plt.ylabel("The numbers", fontsize=16)
plt.legend()
plt.show()實際運行結(jié)果如下:

以上就是Python實現(xiàn)從文件中加載數(shù)據(jù)的方法詳解的詳細內(nèi)容,更多關(guān)于Python 加載數(shù)據(jù)的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
我們?yōu)槭裁匆獪p少Python中循環(huán)的使用
這篇文章主要介紹了我們?yōu)槭裁匆獪p少Python中循環(huán)的使用,我將闡述 Python 提供的一些簡單但是非常有用的結(jié)構(gòu),一些小技巧以及一些我在數(shù)據(jù)科學(xué)工作中遇到的案例。我將討論 Python 中的 for 循環(huán),以及如何盡量避免使用它們,需要的朋友可以參考下2019-07-07
python?tkinter自定義實現(xiàn)Expander控件
和其他成熟的GUI庫相比,tkinter的組件并不是太多,但在自定義組件這一點上,并不遜色于其他框架,下面小編就教大家如何自定義一個Expander控件吧2023-08-08
對python中數(shù)組的del,remove,pop區(qū)別詳解
今天小編就為大家分享一篇對python中數(shù)組的del,remove,pop區(qū)別詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-11-11
使用Python和Tesseract實現(xiàn)驗證碼識別功能
驗證碼識別是一個常見且實用的技術(shù)需求,尤其是在自動化測試和數(shù)據(jù)采集場景中,通過開源 OCR工具 Tesseract,結(jié)合 Python 的強大生態(tài),我們可以高效實現(xiàn)驗證碼識別任務(wù),本篇博客將以詳細步驟和代碼示例,介紹如何使用 Python 和 Tesseract 實現(xiàn)驗證碼識別2025-01-01
使用python?itertools實現(xiàn)計算雙十一滿減湊單
一年一度的雙十一又到了,在這樣一個日子中,可能遇到一些問題,首先是“湊單”問題,本文將使用python中的itertools庫解決這一問題,感興趣的可以了解下2024-11-11
Python jieba 中文分詞與詞頻統(tǒng)計的操作
這篇文章主要介紹了Python jieba 中文分詞與詞頻統(tǒng)計的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03
python 裝飾器功能以及函數(shù)參數(shù)使用介紹
之前學(xué)習(xí)編程語言大多也就是學(xué)的很淺很淺,基本上也是很少涉及到裝飾器這些的類似的內(nèi)容。總是覺得是一樣很神奇的東西,舍不得學(xué)(嘿嘿)。今天看了一下書籍。發(fā)現(xiàn)道理還是很簡單的2012-01-01

