python如何讀取.mtx文件
mtx文件是按照稀疏矩陣格式存儲的矩陣數(shù)據(jù),可以按照以下步驟讀?。?/p>
1、安裝scanpy包
pip install scanpy
2、文件讀取
import scanpy as sc adata = sc.read(filename) data = adata.X
第一行read之后返回的是annData,第二行通過.X操作得到的是矩陣數(shù)據(jù)
3、轉(zhuǎn)換為稠密矩陣
data = data.todense()
直接得到的矩陣是稀疏形式的,通過todense函數(shù)可轉(zhuǎn)換為稠密矩陣
補(bǔ)充:python讀取各種文件方式
Json:
use_time=[]
with open(address,'r') as f: #ubuntu
mobile = json.load(f)
calls = mobile["transactions"][0]["calls"]
for call in calls:
use_time.append(str(call['use_time']))
Excel:
rawdata1=open_workbook(address)
rawdata=rawdata1.sheet_by_index(0)
for i in range(1,rawdata.nrows):
if rawdata.cell(i,date_index).value=="": #跳過空行
continue
else:
if ctype==3: #若為3,則用datetime模塊處理日期
date1=rawdata.cell(i,date_index).value
date2 = xldate_as_tuple(date1,0)
date3=datetime(*date2)
if "." in str(rawdata.cell(i,phone_index).value):
phone1=str(rawdata.cell(i,phone_index).value)[:-2]
else:
phone1=str(rawdata.cell(i,phone_index).value)
寫EXCEL:
Excel_file = xlwt.Workbook()
sheet = Excel_file.add_sheet('sheet0')
header=[u'號碼','日期top1','日期top2','日期top3']
#寫入標(biāo)題行:
for i in range(len(header)):
sheet.write(0,i,header[i])
#開始按行寫入數(shù)據(jù):
for i in range(len(phonelist)):
sheet.write(i+1,0,phonelist[i])
sheet.write(i+1,1,dic[str(phonelist[i])])
#保存EXCEL:
Excel_file.save("C:/Users/Desktop/100個(gè)文件輸出xls/"+str(fileName)+".xls")
CSV:
rawdata=pd.read_csv(address,skip_blank_lines=True) #參數(shù)為去除空行
if 'start_time' or 'begin_time' in rawdata.columns:
if 'start_time' in rawdata.columns:
start_time=rawdata['start_time']
elif 'begin_time' in rawdata.columns:
start_time=rawdata['begin_time']
txt:
rawdata=open(address,'r')
i=0
a=[] #c存放第一行的列名
for line in rawdata:
if i==1: #默認(rèn)第二行開始存儲通話數(shù)據(jù)
a=line.split(',') #逗號作為分隔符
for j in range(len(a)): #查找指定列名所在的列下標(biāo)
if (('-' in str(a[j]))or('/' in str(a[j]))): #判斷日期所在列數(shù)
date_index=j #保存日期的列下標(biāo)
elif str(a[j]).isdigit() and len(str(a[j]))>5: #默認(rèn)全為數(shù)字組成的字符串為電話號碼
phone_index=j
else:
pass
break
else:
i+=1
i=0
for line in rawdata:#開始轉(zhuǎn)存數(shù)據(jù):
if len(line)<10: #跳過空行
continue
data_line=line.split(',') #txt默認(rèn)以','分隔數(shù)據(jù)
if i==0:
pass #第一行為列名,跳過
i+=1
else: #從第二行開始保存數(shù)據(jù)
start_time.append(data_line[date_index])
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Python實(shí)現(xiàn)word文檔內(nèi)容智能提取以及合成
這篇文章主要為大家詳細(xì)介紹了如何使用Python實(shí)現(xiàn)從10個(gè)左右的docx文檔中抽取內(nèi)容,再調(diào)整語言風(fēng)格后生成新的文檔,感興趣的小伙伴可以了解一下2025-04-04
Python集合魔法解鎖數(shù)據(jù)去重技巧應(yīng)用實(shí)例
這篇文章主要為大家介紹了Python集合魔法解鎖數(shù)據(jù)去重技巧應(yīng)用實(shí)例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-11-11
python3+PyQt5 創(chuàng)建多線程網(wǎng)絡(luò)應(yīng)用-TCP客戶端和TCP服務(wù)器實(shí)例
今天小編就為大家分享一篇python3+PyQt5 創(chuàng)建多線程網(wǎng)絡(luò)應(yīng)用-TCP客戶端和TCP服務(wù)器實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06
Pytorch 使用 nii數(shù)據(jù)做輸入數(shù)據(jù)的操作
這篇文章主要介紹了Pytorch 使用 nii數(shù)據(jù)做輸入數(shù)據(jù)的操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05
pytorch 求網(wǎng)絡(luò)模型參數(shù)實(shí)例
今天小編就為大家分享一篇pytorch 求網(wǎng)絡(luò)模型參數(shù)實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12
Python操作MongoDB數(shù)據(jù)庫的方法示例
這篇文章主要介紹了Python操作MongoDB數(shù)據(jù)庫的方法,結(jié)合實(shí)例形式分析了Python命令行模式下操作MongoDB數(shù)據(jù)庫實(shí)現(xiàn)連接、查找、刪除、排序等相關(guān)操作技巧,需要的朋友可以參考下2018-01-01
idea2020手動安裝python插件的實(shí)現(xiàn)方法
這篇文章主要介紹了idea2020手動安裝python插件的實(shí)現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07

