使用 Python 讀取電子表格中的數(shù)據(jù)實(shí)例詳解
Python 是最流行、功能最強(qiáng)大的編程語(yǔ)言之一。由于它是自由開(kāi)源的,因此每個(gè)人都可以使用。大多數(shù) Fedora 系統(tǒng)都已安裝了該語(yǔ)言。Python 可用于多種任務(wù),其中包括處理逗號(hào)分隔值(CSV)數(shù)據(jù)。CSV文件一開(kāi)始往往是以表格或電子表格的形式出現(xiàn)。本文介紹了如何在 Python 3 中處理 CSV 數(shù)據(jù)。
CSV 數(shù)據(jù)正如其名。CSV 文件按行放置數(shù)據(jù),數(shù)值之間用逗號(hào)分隔。每行由相同的字段定義。簡(jiǎn)短的 CSV 文件通常易于閱讀和理解。但是較長(zhǎng)的數(shù)據(jù)文件或具有更多字段的數(shù)據(jù)文件可能很難用肉眼解析,因此在這種情況下計(jì)算機(jī)做得更好。
這是一個(gè)簡(jiǎn)單的示例,其中的字段是 Name、Email 和 Country。在此例中,CSV 數(shù)據(jù)將字段定義作為第一行,盡管并非總是如此。
Name,Email,Country John Q. Smith,jqsmith@example.com,USA Petr Novak,pnovak@example.com,CZ Bernard Jones,bjones@example.com,UK
從電子表格讀取 CSV
Python 包含了一個(gè) csv 模塊,它可讀取和寫入 CSV 數(shù)據(jù)。大多數(shù)電子表格應(yīng)用,無(wú)論是原生(例如 Excel 或 Numbers)還是基于 Web 的(例如 Google Sheet),都可以導(dǎo)出 CSV 數(shù)據(jù)。實(shí)際上,許多其他可發(fā)布表格報(bào)告的服務(wù)也可以導(dǎo)出為 CSV(例如,PayPal)。
Python csv 模塊有一個(gè)名為 DictReader 的內(nèi)置讀取器方法,它可以將每個(gè)數(shù)據(jù)行作為有序字典 (OrderedDict) 處理。它需要一個(gè)文件對(duì)象訪問(wèn) CSV 數(shù)據(jù)。因此,如果上面的文件在當(dāng)前目錄中為 example.csv,那么以下代碼段是獲取此數(shù)據(jù)的一種方法:
f = open('example.csv', 'r')
from csv import DictReader
d = DictReader(f)
data = []
for row in d:
data.append(row)
現(xiàn)在,內(nèi)存中的 data 對(duì)象是 OrderedDict 對(duì)象的列表:
[OrderedDict([('Name', 'John Q. Smith'),
('Email', 'jqsmith@example.com'),
('Country', 'USA')]),
OrderedDict([('Name', 'Petr Novak'),
('Email', 'pnovak@example.com'),
('Country', 'CZ')]),
OrderedDict([('Name', 'Bernard Jones'),
('Email', 'bjones@example.com'),
('Country', 'UK')])]
引用這些對(duì)象很容易:
>>> print(data[0]['Country']) USA >>> print(data[2]['Email']) bjones@example.com
順便說(shuō)一句,如果你需要處理沒(méi)有字段名標(biāo)題行的 CSV 文件,那么 DictReader 類可以讓你定義它們。在上面的示例中,添加 fieldnames 參數(shù)并傳遞一系列名稱:
d = DictReader(f, fieldnames=['Name', 'Email', 'Country'])
真實(shí)例子
我最近想從一長(zhǎng)串人員名單中隨機(jī)選擇一個(gè)中獎(jiǎng)?wù)?。我從電子表格中提取?CSV 數(shù)據(jù)是一個(gè)簡(jiǎn)單的名字和郵件地址列表。
幸運(yùn)的是,Python 有一個(gè)有用的 random 模塊,可以很好地生成隨機(jī)值。該模塊 Random 類中的 randrange 函數(shù)正是我需要的。你可以給它一個(gè)常規(guī)的數(shù)字范圍(例如整數(shù)),以及它們之間的步長(zhǎng)值。然后,該函數(shù)會(huì)生成一個(gè)隨機(jī)結(jié)果,這意味著我可以在數(shù)據(jù)的總行數(shù)范圍內(nèi)獲得一個(gè)隨機(jī)整數(shù)(或者說(shuō)是行號(hào))。
這個(gè)小程序運(yùn)行良好:
from csv import DictReader
from random import Random
d = DictReader(open('mydata.csv'))
data = []
for row in d:
data.append(row)
r = Random()
winner = data[r.randrange(0, len(data), 1)]
print('The winner is:', winner['Name'])
print('Email address:', winner['Email'])
顯然,這個(gè)例子非常簡(jiǎn)單。電子表格本身包含了復(fù)雜的分析數(shù)據(jù)的方法。但是,如果你想在電子表格應(yīng)用之外做某事,Python 或許是一種技巧!
總結(jié)
到此這篇關(guān)于使用 Python 讀取電子表格中的數(shù)據(jù)實(shí)例詳解的文章就介紹到這了,更多相關(guān)python 讀取表格數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python 刪除excel表格重復(fù)行,數(shù)據(jù)預(yù)處理操作
- Python3讀取和寫入excel表格數(shù)據(jù)的示例代碼
- 基于Python快速處理PDF表格數(shù)據(jù)
- Python基于pandas爬取網(wǎng)頁(yè)表格數(shù)據(jù)
- 基于python實(shí)現(xiàn)把json數(shù)據(jù)轉(zhuǎn)換成Excel表格
- python讀取word 中指定位置的表格及表格數(shù)據(jù)
- python 中Arduino串口傳輸數(shù)據(jù)到電腦并保存至excel表格
- Python 用三行代碼提取PDF表格數(shù)據(jù)
- Python獲取數(shù)據(jù)庫(kù)數(shù)據(jù)并保存在excel表格中的方法
- python 獲取頁(yè)面表格數(shù)據(jù)存放到csv中的方法
- python3 讀取Excel表格中的數(shù)據(jù)
- 利用python做表格數(shù)據(jù)處理
相關(guān)文章
Python編程新標(biāo)準(zhǔn)學(xué)會(huì)十項(xiàng)好習(xí)慣提升編碼質(zhì)量
這篇文章主要為大家介紹了Python編程新標(biāo)準(zhǔn)學(xué)會(huì)十項(xiàng)好習(xí)慣提升編碼質(zhì)量,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01
Anaconda虛擬環(huán)境中安裝cudatoolkit和cudnn包并配置pytorch-gpu的配置教程
這篇文章詳細(xì)介紹了如何在Anaconda虛擬環(huán)境中安裝和配置TensorFlow,特別是針對(duì)CUDA和cuDNN的版本管理,文章首先解釋了為什么需要更新TensorFlow版本,然后指導(dǎo)如何創(chuàng)建新的虛擬環(huán)境,需要的朋友可以參考下2025-02-02
python在html中插入簡(jiǎn)單的代碼并加上時(shí)間戳的方法
今天小編就為大家分享一篇python在html中插入簡(jiǎn)單的代碼并加上時(shí)間戳的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-10-10
Python定義一個(gè)跨越多行的字符串的多種方法小結(jié)
今天小編就為大家分享一篇Python定義一個(gè)跨越多行的字符串的多種方法小結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-07-07
Python pygame 項(xiàng)目實(shí)戰(zhàn)事件監(jiān)聽(tīng)
這篇文章主要介紹了Python pygame 項(xiàng)目實(shí)戰(zhàn)事件監(jiān)聽(tīng),文章圍繞主題展開(kāi)詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-08-08
python網(wǎng)絡(luò)爬蟲基于selenium爬取斗魚直播信息
目前是直播行業(yè)的一個(gè)爆發(fā)期,由于國(guó)家對(duì)直播行業(yè)進(jìn)行整頓和規(guī)范,現(xiàn)在整個(gè)直播行業(yè)也在穩(wěn)固發(fā)展。隨著互聯(lián)網(wǎng)和網(wǎng)絡(luò)直播市場(chǎng)的快速發(fā)展,相信未來(lái)還有廣闊的發(fā)展前景。今天用selenium爬取一下斗魚直播信息將代碼分享給大家2022-03-03

