python數(shù)據(jù)處理之如何選取csv文件中某幾行的數(shù)據(jù)
前言
有些人看到這個(gè)問(wèn)題覺得不是問(wèn)題,是嘛,不就是df.col[]函數(shù)嘛,其實(shí)忽略了一個(gè)重點(diǎn),那就是我們要省去把csv文件全部讀取這個(gè)過(guò)程,因?yàn)槿绻诿媾R億萬(wàn)級(jí)別的大規(guī)模數(shù)據(jù),得到的結(jié)果就是boom,boom,boom。
我們要使用一下現(xiàn)成的函數(shù)里面的參數(shù)nrows,和skiprows,一個(gè)代表你要讀幾行,一個(gè)代表你從哪開始讀,這就可以了,比如從第3行讀取4個(gè)
示例代碼
import pandas as pd
df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9],'b':[22,33,44,55,66,77,88,99,10]})
df.to_csv('test.csv')
dt = pd.read_csv('test.csv',skiprows=5,nrows=3)
print(dt)
out:
4 5 66
0 5 6 77
1 6 7 88
2 7 8 99
3 8 9 10
就可以了,不過(guò)這個(gè)列頭不知道是怎么回事,順便如果想根據(jù)列值找index,可以參考下面的
然后
df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},
index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)
df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},
index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)
問(wèn)題得到了解決
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。
相關(guān)文章
pytorch使用過(guò)程中遇到的錯(cuò)誤處理之內(nèi)存溢出問(wèn)題
這篇文章主要介紹了pytorch使用過(guò)程中遇到的錯(cuò)誤處理之內(nèi)存溢出問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-09-09
python檢測(cè)遠(yuǎn)程服務(wù)器tcp端口的方法
這篇文章主要介紹了python檢測(cè)遠(yuǎn)程服務(wù)器tcp端口的方法,涉及Python操作socket檢測(cè)tcp端口的技巧,需要的朋友可以參考下2015-03-03
conda虛擬環(huán)境下使用pyinstaller打包程序?yàn)閑xe文件全過(guò)程
pyinstaller是一個(gè)支持跨平臺(tái)使用的第三方庫(kù),它可以將腳本執(zhí)行所需的模塊和庫(kù),自動(dòng)分析、收集并生成一個(gè)文件夾或者可執(zhí)行文件,這篇文章主要給大家介紹了關(guān)于conda虛擬環(huán)境下使用pyinstaller打包程序?yàn)閑xe文件的相關(guān)資料,需要的朋友可以參考下2023-12-12
python正則表達(dá)式實(shí)現(xiàn)自動(dòng)化編程
這篇文章主要介紹了python正則表達(dá)式實(shí)現(xiàn)自動(dòng)化編程,re模塊的compile()方法是構(gòu)成正則表達(dá)式的方法,向compile()傳入一個(gè)字符串表示正則表達(dá)式,該方法返回一個(gè)Regex模式的對(duì)象,需要的朋友可以參考下2023-01-01
解決pycharm中導(dǎo)入自己寫的.py函數(shù)出錯(cuò)問(wèn)題
今天小編就為大家分享一篇解決pycharm中導(dǎo)入自己寫的.py函數(shù)出錯(cuò)問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02
python自動(dòng)化辦公操作PPT的實(shí)現(xiàn)
這篇文章主要介紹了python自動(dòng)化辦公操作PPT的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-02-02
詳解基于python的全局與局部序列比對(duì)的實(shí)現(xiàn)(DNA)
這篇文章主要介紹了詳解基于python的全局與局部序列比對(duì)的實(shí)現(xiàn)(DNA).文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-10-10

