利用R語(yǔ)言解壓與壓縮.tar.gz.zip等格式文件
最近嘗試用 R 對(duì)一些文件進(jìn)行批量的解壓與壓縮,這里記錄一些常用的解壓與壓縮的方法。
由于解壓與壓縮是對(duì)稱的兩種方法,這里我們著重以對(duì)文件的解壓為例,分不同的格式進(jìn)行講解。
.zip
壓縮:zip()
解壓:unzip()
若要壓縮文件,就直接在 zip() 函數(shù)的第一個(gè)參數(shù)里面輸入壓縮后的文件名,第二個(gè)參數(shù)輸入壓縮前的文件名。
而解壓文件就更簡(jiǎn)單了,直接利用 unzip() 里面加上需要解壓的文件名稱即可。
.tar.gz
壓縮:tar()
解壓:untar()
同 .zip 后綴的壓縮文件。
.gz 與 .bz2
這兩個(gè)壓縮文件與前面的相比,是最與眾不同的,因?yàn)檫@兩種后綴的文件,可以稱之為壓縮文件,也可以直接作為一個(gè)數(shù)據(jù)文件,當(dāng)成 data frame 直接進(jìn)行讀取。因?yàn)槠浔旧砭褪菙?shù)據(jù)文件。
下面我們以 解壓 / 讀取 進(jìn)行詳細(xì)說(shuō)明:
1) 直接解壓
R 中默認(rèn)沒(méi)有解壓相關(guān)文件的函數(shù),需要使用一個(gè)包:R.utils,然后如下述代碼所示,利用 gunzip() 函數(shù),即可解壓。
library(R.utils)
gunzip("file.gz", remove = `TRUE`)
bunzip2("file.bz2", remove = `TRUE`)
注意是這個(gè)函數(shù)里面多了一個(gè) remove = 參數(shù),選擇 TRUE 就會(huì)只保留解壓后的文件,原壓縮包會(huì)被刪除,默認(rèn)就是 TRUE。
解壓之后,我們可以直接用 read.table() 對(duì)其進(jìn)行讀取。
2) 直接讀取
當(dāng)然,如果我們的目的只是讀取其中的數(shù)據(jù),而不是一定需要解壓,則可以使用兩個(gè)默認(rèn)函數(shù)組合的形式,直接對(duì)數(shù)據(jù)進(jìn)行讀取:
dat <- read.table(gzfile("file.gz"))
而針對(duì) 2.10 版本之后的 R,還有另一種更方便的讀取方式,就是直接使用 read.table() 對(duì)其進(jìn)行讀取。
dat <- read.table("file.gz")
參考
untar: Extract Or List Tar Archives
以上就是利用R語(yǔ)言解壓與壓縮.tar.gz.zip等格式文件的詳細(xì)內(nèi)容,更多關(guān)于R語(yǔ)言解壓與壓縮文件的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Flex讀取txt文件中的內(nèi)容報(bào)錯(cuò)原因分析及解決
這篇文章主要介紹了Flex讀取txt文件中的內(nèi)容報(bào)錯(cuò)原因分析及解決,需要的朋友可以參考下2014-05-05
Flex設(shè)置LinkButton的背景色有思路有源碼
Flex中沒(méi)有設(shè)置LinkButton的背景色的屬性,可以直接通過(guò)調(diào)用樣式方法畫(huà)出LinkButton的背景色2014-08-08
flex的tree動(dòng)態(tài)加載大量數(shù)據(jù)與滾動(dòng)條相關(guān)問(wèn)題探討
本文將對(duì)flex的tree動(dòng)態(tài)加載大量數(shù)據(jù)與滾動(dòng)條相關(guān)的問(wèn)題進(jìn)行探討,感興趣的朋友可以參考下哈,希望對(duì)你有所幫助2013-05-05
Flex4 DataGrid中嵌入RadioButton實(shí)現(xiàn)思路及代碼
本節(jié)主要介紹了Flex4 DataGrid中嵌入RadioButton實(shí)現(xiàn)思路及代碼,需要的朋友可以參考下2014-07-07
flex中使用RadioButtonGroup時(shí)取出所選項(xiàng)的值的方法
flex中的RadioButtonGroup想必大家并不陌生吧,在本文將為大家介紹下在使用RadioButtonGroup時(shí)如何取出所選項(xiàng)的值,感興趣的朋友可以參考下2013-12-12
Flex DataGrid自動(dòng)編號(hào)示例
這篇文章主要介紹了Flex DataGrid如何自動(dòng)編號(hào),感興趣的朋友可以參考下2014-05-05
flex 開(kāi)發(fā)項(xiàng)目報(bào)錯(cuò)之404錯(cuò)誤解決方案
最近兩天被HttpStates404這個(gè)錯(cuò)誤折騰的夠嗆,查了很多的文章都是大同小異,接下來(lái)為大家介紹下詳細(xì)的解決方法,感興趣的各位可以參考下哈,希望可以幫助到你2013-03-03
flex4 panel去掉標(biāo)題設(shè)置透明度效果代碼
首先:去掉Panel的標(biāo)題,其次:設(shè)置透明度這個(gè)說(shuō)了也是啰嗦,大家都會(huì),不過(guò)還是提一下吧,具體請(qǐng)祥看本文2013-05-05

