Python 稀疏矩陣-sparse 存儲和轉(zhuǎn)換
稀疏矩陣-sparsep
from scipy import sparse
稀疏矩陣的儲存形式
在科學(xué)與工程領(lǐng)域中求解線性模型時(shí)經(jīng)常出現(xiàn)許多大型的矩陣,這些矩陣中大部分的元素都為0,被稱為稀疏矩陣。用NumPy的ndarray數(shù)組保存這樣的矩陣,將很浪費(fèi)內(nèi)存,由于矩陣的稀疏特性,可以通過只保存非零元素的相關(guān)信息,從而節(jié)約內(nèi)存的使用。此外,針對這種特殊結(jié)構(gòu)的矩陣編寫運(yùn)算函數(shù),也可以提高矩陣的運(yùn)算速度。
scipy.sparse庫中提供了多種表示稀疏矩陣的格式,每種格式都有不同的用處,其中dok_matrix和lil_matrix適合逐漸添加元素。
dok_matrix從dict繼承,它采用字典保存矩陣中不為0的元素:字典的鍵是一個保存元素(行,列)信息的元組,其對應(yīng)的值為矩陣中位于(行,列)中的元素值。顯然字典格式的稀疏矩陣很適合單個元素的添加、刪除和存取操作。通常用來逐漸添加非零元素,然后轉(zhuǎn)換成其它支持快速運(yùn)算的格式。
a = sparse.dok_matrix((10, 5)) a[2:5, 3] = 1.0, 2.0, 3.0 print a.keys() print a.values()
[(2, 3), (3, 3), (4, 3)] [1.0, 2.0, 3.0]
lil_matrix使用兩個列表保存非零元素。data保存每行中的非零元素,rows保存非零元素所在的列。這種格式也很適合逐個添加元素,并且能快速獲取行相關(guān)的數(shù)據(jù)。
b = sparse.lil_matrix((10, 5)) b[2, 3] = 1.0 b[3, 4] = 2.0 b[3, 2] = 3.0 print b.data print b.rows
[[] [] [1.0] [3.0, 2.0] [] [] [] [] [] []] [[] [] [3] [2, 4] [] [] [] [] [] []]
coo_matrix采用三個數(shù)組row、col和data保存非零元素的信息。這三個數(shù)組的長度相同,row保存元素的行,col保存元素的列,data保存元素的值。coo_matrix不支持元素的存取和增刪,一旦創(chuàng)建之后,除了將之轉(zhuǎn)換成其它格式的矩陣,幾乎無法對其做任何操作和矩陣運(yùn)算。
coo_matrix支持重復(fù)元素,即同一行列坐標(biāo)可以出現(xiàn)多次,當(dāng)轉(zhuǎn)換為其它格式的矩陣時(shí),將對同一行列坐標(biāo)對應(yīng)的多個值進(jìn)行求和。在下面的例子中,(2, 3)對應(yīng)兩個值:1和10,將其轉(zhuǎn)換為ndarray數(shù)組時(shí)這兩個值加在一起,所以最終矩陣中(2, 3)坐標(biāo)上的值為11。
許多稀疏矩陣的數(shù)據(jù)都是采用這種格式保存在文件中的,例如某個CSV文件中可能有這樣三列:“用戶ID,商品ID,評價(jià)值”。采用numpy.loadtxt或pandas.read_csv將數(shù)據(jù)讀入之后,可以通過coo_matrix快速將其轉(zhuǎn)換成稀疏矩陣:矩陣的每行對應(yīng)一位用戶,每列對應(yīng)一件商品,而元素值為用戶對商品的評價(jià)。
row = [2, 3, 3, 2] col = [3, 4, 2, 3] data = [1, 2, 3, 10] c = sparse.coo_matrix((data, (row, col)), shape=(5, 6)) print c.col, c.row, c.data print c.toarray()
[3 4 2 3] [2 3 3 2] [ 1 2 3 10] [[ 0 0 0 0 0 0] [ 0 0 0 0 0 0] [ 0 0 0 11 0 0] [ 0 0 3 0 2 0] [ 0 0 0 0 0 0]]
個人操作中選擇,coo_matrix 選在因?yàn)樯婕跋∈杈仃囘\(yùn)算,但是如果不用其他形式存儲則復(fù)雜度太高(時(shí)間和空間)1000*1000的matrix大約話2h,也是要命了。無奈想到了Pajek軟件中數(shù)據(jù)的輸入格式三元組:
所以想到將自己的數(shù)據(jù)處理成類似的三元組!
即“matrix矩陣”—>"tuple三元組"—>"sparseMatrix2tuple"—>"scipy.sparse"
感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!
相關(guān)文章
python密碼學(xué)RSA算法及秘鑰創(chuàng)建教程
這篇文章主要為大家介紹了python密碼學(xué)RSA算法及秘鑰創(chuàng)建教程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05
用Python實(shí)現(xiàn)換行符轉(zhuǎn)換的腳本的教程
這篇文章主要介紹了用Python實(shí)現(xiàn)換行符轉(zhuǎn)換的腳本的教程,代碼非常簡單,包括一個對操作說明的功能的實(shí)現(xiàn),需要的朋友可以參考下2015-04-04
PYQT5 vscode聯(lián)合操作qtdesigner的方法
這篇文章主要介紹了PYQT5 vscode聯(lián)合操作qtdesigner的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-03-03
python 中關(guān)于pycharm選擇運(yùn)行環(huán)境的問題
這篇文章主要介紹了python 中關(guān)于pycharm選擇運(yùn)行環(huán)境的相關(guān)知識,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-10-10
Python列表reverse()函數(shù)使用方法詳解
這篇文章主要詳細(xì)介紹了Python列表reverse()函數(shù)使用方法,文章通過代碼示例講解的非常詳細(xì),對我們的學(xué)習(xí)或工作有一定的幫助,需要的朋友可以參考下2023-07-07

