Python實現(xiàn)從文件中加載數(shù)據(jù)的方法詳解

更新時間：2022年04月29日 09:36:44 作者：codingchen

日常工作中有許多類型的文件，以及許多方法，用它們從文件中提取數(shù)據(jù)來圖形化。本文將利用Python實現(xiàn)從文件中加載數(shù)據(jù)，感興趣的可以了解一下

前幾篇都是手動錄入或隨機函數(shù)產(chǎn)生的數(shù)據(jù)。實際有許多類型的文件，以及許多方法，用它們從文件中提取數(shù)據(jù)來圖形化。

比如之前python基礎(chǔ)(12)介紹打開文件的方式，可直接讀取文件中的數(shù)據(jù)，擴大了我們的數(shù)據(jù)來源。下面，將展示幾種方法。

我們將使用內(nèi)置的 csv 模塊加載CSV文件

CSV文件是一種特殊的文本文件，文件中的數(shù)據(jù)以逗號作為分隔符，很適合進行數(shù)據(jù)的解析。先用excle建立如下表格和數(shù)據(jù)，另存為csv格式文件，放到代碼目錄下。

包含在Python標(biāo)準(zhǔn)庫中自帶CSV 模塊，我們只需要import進來就能使用。比如我們需要將上面的CSV文件都打印出來，代碼如下:

import csv  #import csv 用來導(dǎo)入csv模塊

filename = 'E:\WorkSpace\python\coding\score.csv'  #文件保存的絕對路徑
with open(filename) as file_csv:      #是不是忘記了如何打開文件？打開文件，并將結(jié)果文件對象存儲在file_csv中
    reader = csv.reader(file_csv)     #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容  
    for row in reader: #   用for循環(huán)打印每一行
        print(row)

運行結(jié)果如下：

['Name', 'Grade', 'Class', 'Age', 'mathscore', 'Englishscore']
['Lucy', '7', '2', '14', '95', '86']
['bush', '8', '1', '15', '80', '75']
['lily', '7', '3', '14', '93', '95']
['Jack', '8', '2', '14', '87', '84']
['Mary', '9', '1', '15', '85', '86']
['philip', '7', '3', '14', '90', '92']
['Liming', '9', '2', '16', '99', '87']

打印文件頭及其位置

讀入文件，是為了獲取其中的數(shù)據(jù)，需要將相關(guān)信息進行分離，先看看如何讀出頭即文件的第一行， next()返回文件中的下一行。

import csv  #import csv 用來導(dǎo)入csv模塊

filename = 'E:\WorkSpace\python\coding\score.csv'  #文件保存的絕對路徑
with open(filename) as file_csv:      #是不是忘記了如何打開文件？打開文件，并將結(jié)果文件對象存儲在file_csv中
    reader = csv.reader(file_csv)     #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容  
    header_row = next(reader)   #模塊csv包含函數(shù) next() ，調(diào)用它并將閱讀器對象傳遞給它時，它將返回文件中的下一行。
                                #調(diào)用了next()一次，因此得到的是文件的第一行，其中包含文件頭
? ? ? #for row in reader: # 用for循環(huán)打印每一行? ? ? 　#　print(row)
    for index, column_header in enumerate(header_row):  #對列表調(diào)用了enumerate()來獲取每個元素的索引及其值
        print(index, column_header)

運行后的結(jié)果如下所示：

0 Name
1 Grade
2 Class
3 Age
4 mathscore
5 Englishscore

提取其中索引，即name的索引為0，Grade的索引為1，知道了索引便可以讀取其中的任何數(shù)據(jù)，比如我們要打印出mathscore，索引為4，于是代碼如下：

scores =[] 定義一個空的list
    for row in reader:
        scores.append(int(row[4])) #讀取的文件，默認(rèn)為字符串，用int()轉(zhuǎn)換為數(shù)字。
    print(scores)

運行結(jié)果：

[95, 80, 93, 87, 85, 90, 99]

接下來，制作圖表展示一下，先把mathscore和englishscore分?jǐn)?shù)做個柱狀對比。代碼如下：

import matplotlib.pyplot as plt
import csv  #import csv 用來導(dǎo)入csv模塊

filename = 'E:\WorkSpace\python\coding\score.csv'  #文件保存的絕對路徑
with open(filename) as file_csv:      #是不是忘記了如何打開文件？打開文件，并將結(jié)果文件對象存儲在file_csv中
    reader = csv.reader(file_csv)     #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容   
    header_row = next(reader)   #模塊csv包含函數(shù) next() ，調(diào)用它并將閱讀器對象傳遞給它時，它將返回文件中的下一行。
                                #調(diào)用了 next() 一次，因此得到的是文件的第一行，其中包含文件頭
    mathscores =[] #定義兩個列表
    englishscores=[]
    for row in reader:
        mathscores.append(int(row[4]))     #讀取索引為4的數(shù)據(jù)，默認(rèn)為字符串，用int()轉(zhuǎn)換為數(shù)字。
        englishscores.append(int(row[5]))  #讀取索引為5的數(shù)據(jù)，用int()轉(zhuǎn)換為數(shù)字。
        
plt.bar([1,3,5,7,9,11,13],mathscores,label='math',color='#FF2204')     
plt.bar([2,4,6,8,10,12,14],englishscores, label='englis', color='g')
plt.legend()
plt.title('scores') 
plt.show()

已將那些打印相關(guān)代碼刪除?？催\行結(jié)果：

接下來，我們讀取文件，并根據(jù)文件中的時間來繪制圖表

新建一個年份的數(shù)據(jù)（真的是胡編亂造的數(shù)據(jù)），第一列是年份，第二列每年畢業(yè)的人數(shù)，第三列是每年申請人數(shù)，如圖所示：

要求：

1，按年份分別顯示出每年兩者的人數(shù)，并用不同的顏色表示；

2、兩者間也用其他顏色進行填充。

完成代碼如下：

import matplotlib.pyplot as plt
import csv  #import csv 用來導(dǎo)入csv模塊
from datetime import datetime #引入時間相關(guān)模塊

filename = 'E:\WorkSpace\python\coding\graduatesNumbers.csv'  #文件保存的絕對路徑
with open(filename) as file_csv:      #是不是忘記了如何打開文件？打開文件，并將結(jié)果文件對象存儲在file_csv中
    reader = csv.reader(file_csv)     #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容   
    header_row = next(reader)   
    dates=[]                            
    numbers=[]
    application_numbers=[]
    for row in reader: 
        current_date = datetime.strptime(row[0], "%Y/%m/%d") #年份，strptime()日期格式轉(zhuǎn)化為字符串格式的函數(shù)
        dates.append(current_date)
        numbers.append(int(row[1]))      #讀取索引為1的數(shù)據(jù)，默認(rèn)為字符串，用int()轉(zhuǎn)換為數(shù)字，即Numbers of graduates 。
        application_numbers.append(int(row[2])) #讀取索引為2的數(shù)據(jù)，即Number of applicants
        
plt.plot(dates,numbers,label='Numbers of graduate', c='red') #顯示第一條線
plt.plot(dates,application_numbers,label='Number of applicant', c='green')  #顯示第二條線application_numbers折線
plt.fill_between(dates,numbers, application_numbers, facecolor='blue', alpha=0.5)   #在兩線之間填充顏色  alpha透明度
    
plt.title("The numbers of graduate",fontsize=24)
plt.xlabel('Years', fontsize=16)
plt.ylabel("The numbers", fontsize=16)
plt.legend()
plt.show()

實際運行結(jié)果如下：