Python高效處理CSV、Excel和JSON數(shù)據的實戰(zhàn)指南

更新時間：2025年07月17日 09:03:47 作者：喵手

在現(xiàn)代數(shù)據分析中,Python 無疑是一個強大的工具,特別是在處理各種格式的數(shù)據時,如 CSV、Excel 和 JSON 等,今天,我們將深入探討如何使用 Python 高效地處理這三種最常見的數(shù)據格式,需要的朋友可以參考下

前言

在現(xiàn)代數(shù)據分析中，Python 無疑是一個強大的工具，特別是在處理各種格式的數(shù)據時，如 CSV、Excel 和 JSON 等。數(shù)據的存儲格式不同，我們需要靈活的工具來進行讀取、清洗、轉換和分析。今天，我們將深入探討如何使用 Python 高效地處理這三種最常見的數(shù)據格式。

1. 處理 CSV 數(shù)據

CSV（逗號分隔值）文件是最常見的數(shù)據存儲格式之一。Python 中的 pandas 庫提供了非常方便的工具來讀取、寫入和處理 CSV 文件。下面，我們就從如何讀取 CSV 數(shù)據開始，逐步講解常見操作。

1.1 讀取 CSV 文件

使用 pandas 中的 read_csv() 方法，我們可以非常簡單地加載 CSV 數(shù)據：

import pandas as pd

# 讀取 CSV 文件
df = pd.read_csv('data.csv')

# 查看數(shù)據的前五行
print(df.head())

1.2 寫入 CSV 文件

如果你想將處理后的數(shù)據保存回 CSV 文件，可以使用 to_csv() 方法：

# 將 DataFrame 保存為 CSV 文件
df.to_csv('output.csv', index=False)

index=False 表示不保存行索引，如果不加此參數(shù)，行索引將被包含在 CSV 文件中。

1.3 處理 CSV 中的缺失值

CSV 文件中可能會有缺失值，pandas 提供了處理缺失值的多種方法，比如填充缺失值或刪除包含缺失值的行。

# 刪除含有缺失值的行
df.dropna(inplace=True)

# 用特定值填充缺失值
df.fillna(value={'column_name': 0}, inplace=True)

1.4 篩選與排序數(shù)據

# 篩選某列大于某個值的行
filtered_df = df[df['age'] > 30]

# 根據某一列排序數(shù)據
sorted_df = df.sort_values(by='age', ascending=False)

2. 處理 Excel 數(shù)據

Excel 文件通常包含多個工作表，pandas 通過 read_excel() 提供了讀取 Excel 文件的功能。與 CSV 文件不同，Excel 文件可以包含多個工作表，pandas 允許我們選擇讀取某個特定的工作表，甚至同時讀取多個工作表。

2.1 讀取 Excel 文件

# 讀取 Excel 文件
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')

# 如果不指定 sheet_name，則默認讀取第一個工作表
df = pd.read_excel('data.xlsx')

# 查看數(shù)據的前五行
print(df.head())

2.2 讀取多個工作表

# 讀取多個工作表
df_dict = pd.read_excel('data.xlsx', sheet_name=None)

# 獲取所有工作表的名稱
print(df_dict.keys())

# 訪問某一個工作表
sheet1_df = df_dict['Sheet1']

2.3 寫入 Excel 文件

# 將 DataFrame 寫入 Excel 文件
df.to_excel('output.xlsx', index=False)

2.4 處理 Excel 中的缺失值

# 刪除含有缺失值的行
df.dropna(inplace=True)

# 用均值填充缺失值
df.fillna(df.mean(), inplace=True)

3. 處理 JSON 數(shù)據

JSON 格式是最常用于 Web 應用程序中的數(shù)據交換格式。在 Python 中，處理 JSON 格式的數(shù)據通常依賴 json 模塊和 pandas 庫，后者提供了更強大的功能來處理復雜的 JSON 數(shù)據結構。

3.1 讀取 JSON 文件

使用 pandas 中的 read_json() 方法，我們可以讀取 JSON 數(shù)據：

# 讀取 JSON 文件
df = pd.read_json('data.json')

# 查看數(shù)據的前五行
print(df.head())

3.2 寫入 JSON 文件

將數(shù)據保存為 JSON 格式：

# 將 DataFrame 寫入 JSON 文件
df.to_json('output.json', orient='records', lines=True)

orient='records' 參數(shù)表示將每行數(shù)據保存為一個 JSON 對象。lines=True 參數(shù)會將每條記錄寫入 JSON 格式的一行。

3.3 處理 JSON 格式的嵌套數(shù)據

有時候 JSON 數(shù)據可能包含嵌套的字典或列表結構。我們可以使用 json_normalize() 來將嵌套的數(shù)據平展為一個 DataFrame：

import json
from pandas import json_normalize

# 假設有以下嵌套的 JSON 數(shù)據
data = {
    "id": 1,
    "name": "Alice",
    "address": {
        "city": "New York",
        "zipcode": "10001"
    }
}

# 使用 json_normalize 將嵌套的 JSON 轉換為 DataFrame
df = json_normalize(data)

print(df)

3.4 JSON 中的缺失值處理

如果 JSON 數(shù)據中有缺失值，可以使用和 CSV、Excel 數(shù)據相同的方法來處理它們。

# 刪除含有缺失值的行
df.dropna(inplace=True)

# 用默認值填充缺失值
df.fillna({'column_name': 'default_value'}, inplace=True)

4. 總結

今天，我們介紹了如何使用 Python 中的 pandas 和 json 庫來處理三種常見的數(shù)據格式：CSV、Excel 和 JSON。掌握這些技巧，不僅能幫助你更高效地進行數(shù)據清理和預處理，還能在實際的工作中減少重復性勞動，提高工作效率。

重點回顧：

CSV：通過 read_csv() 讀取，to_csv() 寫入，處理缺失值和篩選數(shù)據。
Excel：通過 read_excel() 讀取，to_excel() 寫入，支持讀取多個工作表。
JSON：通過 read_json() 讀取，to_json() 寫入，處理嵌套數(shù)據和缺失值。

希望通過這篇文章，大家能熟練掌握這三種數(shù)據格式的處理方法，快速應對日常的數(shù)據分析工作。

到此這篇關于Python高效處理CSV、Excel和JSON數(shù)據的實戰(zhàn)指南的文章就介紹到這了,更多相關Python處理CSV、Excel和JSON數(shù)據內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

python中os和sys模塊的區(qū)別與常用方法總結
這篇文章主要給大家介紹了關于python中os和sys模塊的區(qū)別與常用方法的相關資料，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面來一起學習學習吧。
2017-11-11
關于Python中的排列組合生成器詳解
這篇文章主要介紹了關于Python中的排列組合生成器詳解,在Python的內置模塊?functools中，提供了高階類?product()?，用于實現(xiàn)多個可迭代對象中元素的組合，返回可迭代對象中元素組合的笛卡爾積，效果相當于嵌套的循環(huán),需要的朋友可以參考下
2023-07-07
如何使用Python代碼創(chuàng)建表格
如果能夠將我們的無序數(shù)據快速組織成更易讀的格式,對于數(shù)據分析非常有幫助,下面這篇文章主要介紹了關于如何使用Python代碼創(chuàng)建表格的相關資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下
2023-06-06
Python使用Selenium自動進行百度搜索的實現(xiàn)
我們今天介紹一個非常適合新手的python自動化小項目，這個例子非常適合新手學習Python網絡自動化，不僅能夠了解如何使用Selenium，而且還能知道一些超級好用的小工具。感興趣的可以了解一下
2021-07-07
用Python制作音樂海報
這篇文章主要介紹了如何用Python制作音樂海報，幫助大家更好的理解和使用python，感興趣的朋友可以了解下
2021-01-01
python 下載文件的幾種方法匯總
這篇文章主要介紹了python 下載文件的幾種方法匯總，幫助大家更好的理解和使用python，感興趣的朋友可以了解下
2021-01-01
python命令行參數(shù)argparse模塊基本用法詳解
argparse?是python自帶的命令行參數(shù)解析包，可以用來方便地讀取命令行參數(shù)，這篇文章主要介紹了python命令行參數(shù)-argparse模塊基本用法,需要的朋友可以參考下
2023-01-01
Python中NumPy的矩陣與通用函數(shù)
這篇文章主要介紹了Python中NumPy的矩陣與通用函數(shù),Numpy是python的一種開源的數(shù)值計算擴展。這種工具可用來存儲和處理大型矩陣，比Python自身的嵌套列表結構要高效的多支持大量的維度數(shù)組與矩陣運算,需要的朋友可以參考下
2023-07-07
變長雙向rnn的正確使用姿勢教學
這篇文章主要介紹了變長雙向rnn的正確使用姿勢，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2021-05-05
用Python監(jiān)控NASA TV直播畫面的實現(xiàn)步驟
本文分享一個名為"Spacestills"的開源程序，它可以用于查看 NASA TV 的直播畫面（靜止幀）
2021-05-05

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

Python高效處理CSV、Excel和JSON數(shù)據的實戰(zhàn)指南

目錄

前言

1. 處理 CSV 數(shù)據

1.1 讀取 CSV 文件

1.2 寫入 CSV 文件

1.3 處理 CSV 中的缺失值

1.4 篩選與排序數(shù)據

2. 處理 Excel 數(shù)據

2.1 讀取 Excel 文件

2.2 讀取多個工作表

2.3 寫入 Excel 文件

2.4 處理 Excel 中的缺失值

3. 處理 JSON 數(shù)據

3.1 讀取 JSON 文件

3.2 寫入 JSON 文件

3.3 處理 JSON 格式的嵌套數(shù)據

3.4 JSON 中的缺失值處理

4. 總結

重點回顧：

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线 免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

Python高效處理CSV、Excel和JSON數(shù)據的實戰(zhàn)指南

目錄

前言

1. 處理 CSV 數(shù)據

1.1 讀取 CSV 文件

1.2 寫入 CSV 文件

1.3 處理 CSV 中的缺失值

1.4 篩選與排序數(shù)據

2. 處理 Excel 數(shù)據

2.1 讀取 Excel 文件

2.2 讀取多個工作表

2.3 寫入 Excel 文件

2.4 處理 Excel 中的缺失值

3. 處理 JSON 數(shù)據

3.1 讀取 JSON 文件

3.2 寫入 JSON 文件

3.3 處理 JSON 格式的嵌套數(shù)據

3.4 JSON 中的缺失值處理

4. 總結

重點回顧：

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕