python 使用pandas讀取csv文件的方法

更新時(shí)間：2022年12月23日 14:32:44 作者：小白和小耳朵

這篇文章主要介紹了python 使用pandas讀取csv文件的方法,本文結(jié)合示例代碼給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值，需要的朋友可以參考下

# -*- coding: utf-8 -*-
"""
Created on Mon Jan 24 16:48:32 2022

@author: zxy
"""

# 導(dǎo)入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
import seaborn as sns; plt.style.use('ggplot')

import sklearn
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.utils import shuffle
from sklearn.metrics import confusion_matrix
from sklearn.manifold import TSNE

# 導(dǎo)入并查看數(shù)據(jù)
crecreditcard_data=pd.read_csv('./creditcard.csv')
crecreditcard_data.shape,crecreditcard_data.info()

crecreditcard_data.describe()


crecreditcard_data.head()

# 看看欺詐與非欺詐的比例如何
count_classes=pd.value_counts(crecreditcard_data['Class'],sort=True).sort_index()

# 統(tǒng)計(jì)下具體數(shù)據(jù)
count_classes.value_counts()
# 也可以用count_classes[0],count_classes[1]看分別數(shù)據(jù)

count_classes.plot(kind='bar')
plt.show()

知識(shí)點(diǎn)擴(kuò)展：

pandas讀取csv文件的操作

1. 讀取csv文件

import pandas as pd
import numpy as np
 
# 讀取整個(gè)csv文件
csv_data = pd.read_csv("./stock_day.csv")
 
# 讀取指定列索引字段的數(shù)據(jù)
csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close'])
 
# 將我們修改完的csv的文件保存到新的路徑下
csv_data.to_csv('demo.csv')

觀察我們保存的文件的格式(行索引為我們的日期, 列索引為 open close) :

# 查看新保存的文件
new_data = read_csv('./demo.csv')

觀察新保存的文件(我們?cè)谧x取的時(shí)候默認(rèn)給我們添加了新的行索引, 及Unnamed:0):

使用to_csv的時(shí)候, 我們可以給他傳入幾個(gè)參數(shù):

csv_data.to_csv('demo.csv', header=True, index=False)

to_csv這個(gè)方法中可以傳遞一些參數(shù):

DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)

path_or_buf :文件保存的路徑;
sep :默認(rèn)是以 , 進(jìn)行分割 , 也可以自己制定;
columns : 保存索引列和指定列;
index:是否寫(xiě)進(jìn)行索引 0或者1;
header :boolean or list of string, default True,是否寫(xiě)進(jìn)列索引值 0或者 1;
na_rep=NaN: 缺失值保存為Na 如果不寫(xiě) 默認(rèn)為空;
float_format='%.2f' :保留兩位小數(shù);

再來(lái)回顧一下將我們的行索引裝成日期格式的方法:

# 生成一個(gè)時(shí)間的序列，略過(guò)周末非交易日
date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B')
 
# index代表行索引，columns代表列索引
new_data = pd.DataFrame(new_data, index=date)

到此這篇關(guān)于python 使用pandas讀取csv文件的方法的文章就介紹到這了,更多相關(guān)python 讀取csv文件內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: