Hadoop中namenode和secondarynamenode工作機(jī)制講解
1)流程

2)FSImage和Edits
nodenode是HDFS的大腦,它維護(hù)著整個(gè)文件系統(tǒng)的目錄樹(shù),以及目錄樹(shù)里所有的文件和目錄,這些信息以倆種文件存儲(chǔ)在文件系統(tǒng):一種是命名空間鏡像(也稱為文件系統(tǒng)鏡像,File System Image,FSImage),即HDFS元數(shù)據(jù)的完整快照,每次NameNode啟動(dòng)的時(shí)候,默認(rèn)會(huì)加載最新的命名空間鏡像,另一種是命令空間鏡像的編輯日志(Edit log)。
FSImage文件其實(shí)是文件系統(tǒng)元數(shù)據(jù)的一個(gè)永久性檢查點(diǎn),但并非每一個(gè)寫操作都會(huì)更新這個(gè)文件,因?yàn)镕SImage是一個(gè)大型文件,如果頻繁地執(zhí)行寫操作,會(huì)使系統(tǒng)運(yùn)行極為緩慢。解決方案是NameNode只將改動(dòng)內(nèi)容預(yù)寫日志,即寫入命名空間鏡像的編輯日志.隨著時(shí)間的推移,編輯日志會(huì)變得越來(lái)越大,那么一旦發(fā)生故障,將會(huì)話費(fèi)非常多的時(shí)間來(lái)回滾操作,所以就像傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)一樣,需要定期地合并FSImage和編輯日志。如果由NameNode來(lái)做合并操作,那么NameNode在為集群提供服務(wù)時(shí)可能無(wú)法提供足夠的資源,為了徹底解決這一問(wèn)題,SecondaryNameNode應(yīng)允而生。
3)第一階段:namenode 啟動(dòng)
- (1)第一次啟動(dòng) namenode 格式化后,創(chuàng)建 fsimage 和 edits 文件。如果不是第一次啟動(dòng),直接加載編輯日志和鏡像文件到內(nèi)存。
- (2)客戶端對(duì)元數(shù)據(jù)進(jìn)行增刪改的請(qǐng)求。
- (3)namenode 記錄操作日志,更新滾動(dòng)日志。
- (4)namenode 在內(nèi)存中對(duì)數(shù)據(jù)進(jìn)行增刪改查。
4)第二階段:Secondary NameNode 工作
- (1)Secondary NameNode 詢問(wèn) namenode 是否需要 checkpoint。直接帶回 namenode 是否檢查結(jié)果。
- (2)Secondary NameNode 請(qǐng)求執(zhí)行 checkpoint。
- (3)Secondary NameNode引導(dǎo)namenode 滾動(dòng)更新編輯正在寫的 edits 日志。
- (4) Secondary NameNode載入FSImage文件,回放編輯日志,將其合并到FSImage,將新的FSImage文件壓縮后寫入磁盤。
- (5)拷貝 fsimage到 namenode。
- (6)namenode 將 fsimage重新命名成 fsimage。
默認(rèn)情況下,該過(guò)程每小時(shí)發(fā)生一次,或者當(dāng)NameNode的編輯日志文件到達(dá)默認(rèn)的64MB也會(huì)觸發(fā)。
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接
相關(guān)文章
github pull最新代碼實(shí)現(xiàn)方法
本文主要介紹 github pull最新代碼的資料,這里對(duì) github pull最新代碼做了詳細(xì)流程介紹,有需要的小伙伴可以參考下2016-09-09
微服務(wù)架構(gòu)之服務(wù)注冊(cè)與發(fā)現(xiàn)功能詳解
這篇文章主要為大家介紹了微服務(wù)架構(gòu)之服務(wù)注冊(cè)與發(fā)現(xiàn)的功能詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步早日升職加薪2022-01-01
使用Npcap庫(kù)開(kāi)發(fā)簡(jiǎn)單的掃描功能
nmap(Network?Mapper)是一款開(kāi)源免費(fèi)的針對(duì)大型網(wǎng)絡(luò)的端口掃描工具,nmap可以檢測(cè)目標(biāo)主機(jī)是否在線、主機(jī)端口開(kāi)放情況、檢測(cè)主機(jī)運(yùn)行的服務(wù)類型及版本信息、檢測(cè)操作系統(tǒng)與設(shè)備類型等信息,本文主要介紹nmap工具安裝和基本使用方法,2024-08-08
構(gòu)建基于虛擬用戶的vsftpd服務(wù)器應(yīng)用
這篇文章主要介紹了構(gòu)建基于虛擬用戶的vsftpd服務(wù)器應(yīng)用,需要的朋友可以參考下2017-05-05
搭建hMailServer服務(wù)實(shí)現(xiàn)遠(yuǎn)程發(fā)送郵件的圖文教程
hMailServer是一個(gè)郵件服務(wù)器,通過(guò)它我們可以搭建自己的郵件服務(wù),本文主要介紹了搭建hMailServer服務(wù)實(shí)現(xiàn)遠(yuǎn)程發(fā)送郵件的圖文教程,具有一定的參考價(jià)值,感興趣的可以了解一下2023-08-08
rsync備份海量文件時(shí)占用大量?jī)?nèi)存的解決方法
這篇文章主要介紹了rsync備份海量文件時(shí)占用大量?jī)?nèi)存的解決辦法,需要的朋友可以參考下2016-07-07

