NameNode?重啟恢復(fù)數(shù)據(jù)的流程詳解
NameNode 重啟恢復(fù)數(shù)據(jù)的流程
我們都知道 NameNode 中存儲的是分布式存儲系統(tǒng)的元數(shù)據(jù),在 NameNode 重啟之后,內(nèi)存的數(shù)據(jù)已經(jīng)丟失了的,所以需要重新加載數(shù)據(jù)。
這時候我們采用的方法是 FsImage 快照 + editslog 操作日志兩種結(jié)合的方法;
那它們是怎么結(jié)合的呢?換句話說,這兩種機制是通過什么聯(lián)系起來的呢??
FsImage 和 editslog 的聯(lián)系
在內(nèi)存時的標(biāo)識
FsImage 是由 editslog 經(jīng)過 checkpoint 機制而得到的,也就是說先有 editslog 再有 FsImage,那么我們來回顧一下 editslog 的組織格式:
message EditLog {
int64 txId = 1;
// 操作類型
int32 opType = 2;
string path = 3;
map<string, string> attr = 4;
}
可以看到 editslog 中是有一個 txId 的屬性的,這個屬性是自增的(long 類型,64位取值范圍非常大,理論上不會超出了的);txId 是 editslog 的唯一標(biāo)識。
txId 是在內(nèi)存中維護著的,每生成一個 editslog 都會將當(dāng)前 txid 賦值給它,并將 txid + 1;這個在內(nèi)存維護的 txid 是當(dāng)前系統(tǒng)中最大的 txid 即 max_txid ,在生成 FsImage 會將系統(tǒng)中所有數(shù)據(jù)生成快照,并將當(dāng)前 max_txid 賦值給它。
我們都知道 FsImage 中有兩個重要的屬性:
public class FsImage {
......
/**
* 當(dāng)前最大的txId
*/
private long maxTxId;
/**
* 內(nèi)容
*/
private INode iNode;
......
}
iNode 其實就是元數(shù)據(jù),而 maxTxId 其實就是生成 FsImage 時,系統(tǒng)中的 max_txid。
在磁盤中的標(biāo)識
上述我們介紹了 FsImage 和 editslog 數(shù)據(jù)在內(nèi)存中的標(biāo)識,但是這兩樣數(shù)據(jù)都是需要持久化的,那么在持久化之后,怎么標(biāo)識他們呢?
我們都知道他們的數(shù)據(jù)中包含了 txid ,可是這個數(shù)據(jù)是需要加載進內(nèi)存才能看到的。。。
為了在剛恢復(fù)數(shù)據(jù)的時候,也能看到 txid (系統(tǒng)是根據(jù) txid 來聯(lián)系 FsImage 和 editslog, 進行數(shù)據(jù)恢復(fù)的),所以在持久化的時候,我們對這兩種文件的命名進行了特殊的組織格式:
fsimage文件的文件名是"fsimage_txid",其中 txid 是文件系統(tǒng)狀態(tài)的事務(wù)ID
editslog 文件的文件名是類似 “1_1000.log” 這種格式(editslog 記錄的可能是多條數(shù)據(jù))
恢復(fù)元數(shù)據(jù)的流程
- 根據(jù)指定路徑,找到 FsImage 文件的存放地點
- 排序,找出 txid 最大的 FsImage (即最新的 FsImage)
- 解析最新的 FsImage 數(shù)據(jù)進內(nèi)存
- 找到 editslog,并將其排序,找出 txid 比最新 FsImage 的 txid 還大的所有 editslog 文件
- 將返回的editslog文件數(shù)據(jù)解析進內(nèi)存
以上就是NameNode 重啟恢復(fù)數(shù)據(jù)的流程詳解的詳細(xì)內(nèi)容,更多關(guān)于NameNode 重啟恢復(fù)數(shù)據(jù)的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Java虛擬機內(nèi)存結(jié)構(gòu)及編碼實戰(zhàn)分享
這篇文章主要介紹了Java虛擬機內(nèi)存結(jié)構(gòu)及編碼實戰(zhàn)分享,文章圍繞詳細(xì)主題展開相關(guān)資料具有一定的參考價值,需要的小伙伴可以參考一下2022-04-04
Java中Lambda表達式和函數(shù)式接口的使用和特性
Java Lambda表達式是一種函數(shù)式編程的特性,可簡化匿名內(nèi)部類的寫法,與函數(shù)式接口搭配使用,實現(xiàn)代碼簡潔、可讀性高、易于維護的特點,適用于集合操作、多線程編程等場景2023-04-04
spring注解如何為bean指定InitMethod和DestroyMethod
這篇文章主要介紹了spring注解如何為bean指定InitMethod和DestroyMethod,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-11-11
PowerJob?AbstractSqlProcessor方法工作流程源碼解讀
這篇文章主要為大家介紹了PowerJob?AbstractSqlProcessor方法工作流程源碼解讀,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-01-01
Java基礎(chǔ)知識之成員變量和局部變量淺顯易懂總結(jié)
從語法形式上,看成員變量是屬于類的,而局部變量是在方法中定義的變量或是方法的參數(shù);成員變量可以被public,private,static等修飾符所修飾,而局部變量不能被訪問控制修飾符及static所修飾2021-09-09
springboot的切面應(yīng)用方式(注解Aspect)
文章總結(jié):Spring?Boot提供了三種攔截器:Filter、Interceptor和Aspect,Filter主要用于內(nèi)容過濾和非登錄狀態(tài)的非法請求過濾,無法獲取Spring框架相關(guān)的信息,Interceptor可以在獲取請求類名、方法名的同時,獲取請求參數(shù),但無法獲取參數(shù)值2024-11-11

