Python處理mat文件的三種方式小結(jié)
處理mat文件的三種方式
讀書的時(shí)候,處理數(shù)據(jù)都是采用matlab,但畢業(yè)后當(dāng)了程序員,matlab從此在自己的電腦上消失了(安裝包太大,還要license,啟動(dòng)也好慢,不符合程序員的需求)。
但是最近公司仿真的數(shù)據(jù)是以matlab的.mat格式存儲(chǔ)的,需要讀取出來處理,那就找找python相關(guān)的庫吧,沒有python干不了的活?。?!
mat文件存儲(chǔ)了matlab中變量數(shù)據(jù),因此,python讀出的mat數(shù)據(jù)是以k-v形式存儲(chǔ)在字典里,key是變量名,value是數(shù)據(jù)內(nèi)容:
scipy
最先想到的的是scipy工具
import scipy.io as scio data = scio.loadmat(‘example.mat') data[‘loss']
但是讀取有的.mat文件的時(shí),會(huì)拋出異常(v7.3版本):
raise NotImplementedError('Please use HDF reader for matlab v7.3 files')NotImplementedError: Please use HDF reader for matlab v7.3 files
h5py
遇到上面的問題,就需要采用h5py庫了:
import h5py
data=h5py.loadmat('example.mat') ??
data['loss'][:]但是這樣讀出來的是file格式,調(diào)試的時(shí)候都很難知道key是什么,取數(shù)據(jù)可以按照key來取,但是前提是需要知道key值,不方便獨(dú)立調(diào)試。
mat73
今天的主角登場,個(gè)人覺得mat73兼容性最好,幾乎所有的mat文件都能成功讀取,而且讀取的結(jié)果是k-v的字典,很便于后續(xù)處理:
import mat73 data=mat73.loadmat(path) ?? data['loss']
mat4py
不推薦,兼容性較差,可能是沒有后續(xù)更新。
總結(jié):總的來說,個(gè)人比較推薦使用mat73,兼容各種版本的mat文件,其次可以比較清晰的看到mat文件中保存數(shù)據(jù)的key值,便于后續(xù)的提取。
python操作.mat文件
在win10中,打開
ITC_VD 數(shù)據(jù)集格式,
結(jié)果在訓(xùn)練集ITC_VD_Training_Testing_set中,看到標(biāo)簽文件全是快捷方式,
選中一個(gè)文件,右鍵 屬性,看到:
Microsoft Access Table Shortcut (.mat)
查了半天,發(fā)現(xiàn)是.mat 的 matlab格式,
python讀取.mat格式
from scipy.io import loadmat?? m = loadmat(r"E:\data\yolov5_dbb\ITC_VD_Training_Testing_set\Training\GT/00064.mat") ? daaa=m.keys() print(daaa) ? print(m['x00064'])
.mat 文件里的數(shù)據(jù)結(jié)構(gòu)是 dict ,所以取值要按照 key:value 的形式:
上面讀出來的數(shù)據(jù)是 ndarray 類型,為了方便數(shù)據(jù)的展示,我們可以將其轉(zhuǎn)換為,pandas的DataFrame:
import pandas as pd ? df = pd.DataFrame(m['H_BETA']) ? df.head()
mat轉(zhuǎn)圖片
import glob?
import cv2
import numpy as np
?
r_path=r'C:\File\2021-11'
?
files=glob.glob(r_path+"/*.mat")
from scipy.io import loadmat?
?
# 數(shù)據(jù)矩陣轉(zhuǎn)圖片的函數(shù)
def MatrixToImage(data):
? ? # data = data * 255
? ? new_im = data.astype(np.uint8)
? ? return new_im?
?
for file in files:
?
? ? if "2018" in file:
? ? ? ? continue
? ? print(file)
? ? m = loadmat(file)
?
? ? daaa = m.keys()
?
? ? data=m['groundTruth']
?
? ? print(data)
?
? ? new_im = MatrixToImage(data)
? ? cv2.imshow("asdf",new_im)
? ? cv2.waitKey()
?
? ? # print(data)以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python機(jī)器學(xué)習(xí)算法之k均值聚類(k-means)
這篇文章主要為大家詳細(xì)介紹了Python機(jī)器學(xué)習(xí)算法之k均值聚類,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-02-02
在Python中使用SimpleParse模塊進(jìn)行解析的教程
這篇文章主要介紹了在Python中使用SimpleParse模塊進(jìn)行解析的教程,文章來自于IBM官方的開發(fā)者技術(shù)文檔,需要的朋友可以參考下2015-04-04
Python如何實(shí)現(xiàn)大型數(shù)組運(yùn)算(使用NumPy)
這篇文章主要介紹了Python如何實(shí)現(xiàn)大型數(shù)組運(yùn)算,文中講解非常細(xì)致,幫助大家更好的了解和學(xué)習(xí),感興趣的朋友可以了解下2020-07-07

