python 讀取以空格分開的文件操作
在查找數(shù)據(jù)集的時(shí)候發(fā)現(xiàn),并不是所有的數(shù)據(jù)集都是以csv的格式存儲(chǔ),也就是每一列特征數(shù)據(jù)的分割并不是都以逗號(hào)分割,有的數(shù)據(jù)格式是以空格為分割
例如.data格式,
接下來就實(shí)現(xiàn)對(duì).data格式數(shù)據(jù)的讀取:
(數(shù)據(jù)來源于Boston房價(jià)預(yù)測數(shù)據(jù)集,文件名稱為“housing.data”)
import pandas as pd
data = pd.read_csv('./housing.data', delim_whiteshape=True)
以上代碼就是實(shí)現(xiàn)了對(duì)空格的分割,但是不知道針對(duì)也是以一列存儲(chǔ),并且數(shù)據(jù)分割也是空格的csv文件此方法還行得通不。
另外pd.read_csv()中的參數(shù)sep和delimiter表示的意義一樣,具體如何使用不清楚,目前用到不多。
遇到讀取文件不知如何操作的,最后要訪問下官方文檔或者google查詢。
pd.read_csv官方文檔
另外,可以直接在原數(shù)據(jù)集文件加后綴名.csv即可轉(zhuǎn)換成csv文件,但前提是data中的數(shù)據(jù)已經(jīng)以,分割好了。
pd.read_csv()中讀取文件時(shí),默認(rèn)第一行作為列名,但有時(shí)候第一行也是我們需要的數(shù)據(jù),這時(shí)需制定參數(shù)header=None,或者給每列提前設(shè)置好名字,names=[‘column0',‘column1',…]
補(bǔ)充:python 實(shí)現(xiàn)以空格分隔的文件讀寫及二維數(shù)組按列折半查找
最近文件讀寫的工作比較多,每一次讀文件都會(huì)寫單獨(dú)的函數(shù)來適應(yīng)文件格式,所以寫了一個(gè)類對(duì)文件進(jìn)行操作。
(用pandas.read_csv讀取文件更好用)
import os
class DealData:
# 數(shù)據(jù)加載函數(shù)
def load(self, filename):
data = []
file = open(filename, 'r')
for line in file.readlines():
line = line.strip('\n') # 除去換行
line = line.split(' ') # 文件以“ ”分隔
if "" in line: # 解決每行結(jié)尾有空格的問題
line.remove("")
data.append(line)
file.close()
return data
# 折半查找 # array是一個(gè)二維數(shù)組,函數(shù)實(shí)現(xiàn)的功能是按照array的第lie列折半查找
def search(self, array, lie, target):
low = 0
high = len(array) - 1
while array[low][lie] <= array[high][lie]:
mid = int((low + high) / 2)
midval = array[mid][lie]
if midval < target:
low = mid + 1
elif midval > target:
high = mid - 1
if high < 0 or low >= len(array):
break
return high
# 將數(shù)據(jù)保存到文件
def save(self, data, filename):
file = open(filename, 'w')
for i in range(0, len(data), 1):
for k in range(0, len(data[i]), 1):
file.write(str(data[i][k]))
file.write(" ")
file.write("\n")
file.close()
可以將Dealdata類單獨(dú)創(chuàng)建一個(gè)python文件,命名為Dealdata,調(diào)用方法如下:
from DealData import DealData
deal = DealData()
totaldata = deal.load("E:\low_data.txt")
之前先引用類:from Dealdata import Dealdata, 其中第一個(gè)Dealdata為被調(diào)用的python文件名, 第二個(gè)Dealdata為被調(diào)用的類名。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
終端能到import模塊 解決jupyter notebook無法導(dǎo)入的問題
這篇文章主要介紹了在終端能到import模塊 而在jupyter notebook無法導(dǎo)入的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-03-03
python GUI庫圖形界面開發(fā)之PyQt5滾動(dòng)條控件QScrollBar詳細(xì)使用方法與實(shí)例
這篇文章主要介紹了python GUI庫圖形界面開發(fā)之PyQt5滾動(dòng)條控件QScrollBar詳細(xì)使用方法與實(shí)例,需要的朋友可以參考下2020-03-03
python 實(shí)現(xiàn)調(diào)用子文件下的模塊方法
今天小編就為大家分享一篇python 實(shí)現(xiàn)調(diào)用子文件下的模塊方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-12-12
Pytorch使用DataLoader實(shí)現(xiàn)批量加載數(shù)據(jù)
這篇文章主要介紹了Pytorch使用DataLoader實(shí)現(xiàn)批量加載數(shù)據(jù)方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-02-02
Python繪圖之自定義圖類型控件實(shí)現(xiàn)混合類型圖表
這篇文章主要為大家詳細(xì)介紹了Python如何新建繪圖類型控件,實(shí)現(xiàn)混合類型圖表,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2023-08-08
Python虛擬機(jī)棧幀對(duì)象及獲取源碼學(xué)習(xí)
這篇文章主要為大家介紹了Python虛擬機(jī)棧幀對(duì)象及獲取源碼學(xué)習(xí),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03

