python數(shù)據(jù)分析之文件讀取詳解
前言:
如果你使用的是Anaconda中的Jupyter,則不需要下載Pands和Numpy庫;如果你使用的是pycharm或其他集成環(huán)境,則需要Pands和Numpy庫
一·Numpy庫中操作文件
1.操作csv文件
import numpy as np
a=np.random.randint(0,10,size=(3,4))
np.savetext("score.csv",a,deliminter=",")
a:自己隨便創(chuàng)建的數(shù)組,deliminter:分隔符,score:要讀取的文件名
或者
import numpy as np
data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)
skiprows:跳過第一行,dtype:數(shù)據(jù)讀出的類型為字符型
2.在pycharm中操作csv文件
import csv
with open("score.csv",'r')as fp:
reader=csv.reader(fp)
for x in reader:
print(x)
reader:迭代器
3.其他情況(.npy類型文件)
import numpy as np
c=np.random.randint(0,10,size=(2,3))
np.save("文件名",c)
c1=np.load("文件名.npy")
二·Pandas庫中操作文件
1.操作csv文件
import pandas as pd
df=pd.read_csv("exl.csv")
或者
import pandas as pd
pd.read_table("exl.csv",sep=',')
sep:分隔符
2.從剪貼板上復(fù)制數(shù)據(jù)
import pandas as pd BS=pd.read_clipboard
3.讀取excel或xlsx文件
import pandas as pd
df=read_excel("exl.xlsx")
三·補(bǔ)充
1.常用
import osos.chdir()
chdir()中寫上你想讀取文件的目錄,表示將目錄轉(zhuǎn)化到你想讀取文件的目錄.
2.pandas中讀取文件的函數(shù)
read_csv? 從文件,URL,文件型對(duì)象中加載帶分隔符的數(shù)據(jù)。默認(rèn)分隔符為逗號(hào)
read_table? ?同上,但默認(rèn)分隔符為制表符(“t”)
read_fwf? 讀取定寬列格式數(shù)據(jù)(無分隔符)
read_clipboard? 讀取剪貼板中的數(shù)據(jù)
read_excel? 從Excel 或xlsx文件中讀取表格數(shù)據(jù)
read_hdf? ?讀取pandas寫的HDF5文件
read_html? 讀取html文檔中的所以表格
read_json? ? 讀取json字符串中的數(shù)據(jù)
read_msgpack 二進(jìn)制格式編碼的pandas數(shù)據(jù)
read_pickle? 讀取python pickle 格式中存儲(chǔ)的任意對(duì)象
read_sas? ?讀取存儲(chǔ)于SAS系統(tǒng)自定義存儲(chǔ)格式為SAS數(shù)據(jù)集
read_sql? ?讀取SQL查詢結(jié)果為pandas的DataFrame
read_stata 讀取stata文件格式的數(shù)據(jù)集
總結(jié)
到此這篇關(guān)于python數(shù)據(jù)分析之文件讀取詳解的文章就介紹到這了,更多相關(guān)python文件讀取內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python數(shù)據(jù)類型相關(guān)知識(shí)擴(kuò)展
今天帶大家學(xué)習(xí)Python數(shù)據(jù)類型的擴(kuò)展知識(shí),文中有非常詳細(xì)的介紹介代碼示例,對(duì)正在學(xué)習(xí)python的小伙伴有很大的幫助,需要的朋友可以參考下2021-05-05
python中pyqtgraph知識(shí)點(diǎn)總結(jié)
在本篇文章里小編給大家整理的是一篇關(guān)于python中pyqtgraph知識(shí)點(diǎn)總結(jié)內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。2021-01-01
Python使用gmplot創(chuàng)建動(dòng)態(tài)地圖可視化
gmplot 是一個(gè) Python 庫,用于基于 Google Maps 的靜態(tài)地圖生成可視化,它提供簡(jiǎn)單的 API 來繪制標(biāo)記、路徑、熱力圖等地理信息數(shù)據(jù),本文給大家介紹了如何使用 gmplot 在 Python 中創(chuàng)建動(dòng)態(tài)地圖可視化,需要的朋友可以參考下2024-12-12
python tornado獲取請(qǐng)求參數(shù)的方法
在Tornado框架中,獲取請(qǐng)求參數(shù)包括查詢字符串參數(shù)、表單數(shù)據(jù)和JSON數(shù)據(jù)等,JSON數(shù)據(jù)通過直接訪問self.request.json獲取,正確處理這些數(shù)據(jù)需要注意請(qǐng)求的Content-Type和數(shù)據(jù)格式,感興趣的朋友跟隨小編一起看看吧2024-09-09
Python基于詞頻排序?qū)崿F(xiàn)快速挖掘關(guān)鍵詞
這篇文章主要為大家詳細(xì)介紹了Python如何基于詞頻排序?qū)崿F(xiàn)快速挖掘關(guān)鍵詞功能,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下2023-03-03
Python實(shí)現(xiàn)五子棋人機(jī)對(duì)戰(zhàn)?和人人對(duì)戰(zhàn)
這篇文章主要介紹了Python實(shí)現(xiàn)五子棋人機(jī)對(duì)戰(zhàn)?和人人對(duì)戰(zhàn),通過定義黑白子,落子位置以及獲勝規(guī)則展開詳細(xì)內(nèi)容,需要的小伙伴可以參考一下2022-05-05
Python基于DFA算法實(shí)現(xiàn)內(nèi)容敏感詞過濾
DFA?算法是通過提前構(gòu)造出一個(gè)?樹狀查找結(jié)構(gòu),之后根據(jù)輸入在該樹狀結(jié)構(gòu)中就可以進(jìn)行非常高效的查找。本文將利用改算法實(shí)現(xiàn)敏感詞過濾,需要的可以參考一下2022-04-04

