存儲(chǔ)raid5兩塊盤(pán)掉線(xiàn)導(dǎo)致數(shù)據(jù)丟失的恢復(fù)全過(guò)程
1. 故障描述
本案例是HP P2000的存儲(chǔ)vmware exsi虛擬化平臺(tái),由RAID-5由10塊lT硬盤(pán)組成,其中6號(hào)盤(pán)是熱備盤(pán),由于故障導(dǎo)致RAID-5磁盤(pán)陣列的兩塊盤(pán)掉線(xiàn),表現(xiàn)為兩塊硬盤(pán)亮黃燈。 經(jīng)用戶(hù)方維護(hù)人員檢測(cè),故障硬盤(pán)應(yīng)為物理故障,表現(xiàn)為:序列號(hào)無(wú)法讀取,在SAS擴(kuò)展卡上硬盤(pán)無(wú)法識(shí)別。

2. 數(shù)據(jù)備份與修復(fù)
故障發(fā)生后用戶(hù)方工程師與我公司聯(lián)系,經(jīng)過(guò)詳細(xì)咨詢(xún),了解到故障比較嚴(yán)重,必須把RAID-5磁盤(pán)陣列帶到我公司進(jìn)行檢測(cè),檢測(cè)RAID-5的每塊成員盤(pán)是物理故障(磁頭損壞或者盤(pán)片劃傷)還是邏輯故障。由于情況緊急,工程師在接到原盤(pán)以后,立即著手準(zhǔn)備檢測(cè)。對(duì)能識(shí)別的好盤(pán)用連接到北亞鏡像服務(wù)器上使用WinHex做扇區(qū)級(jí)鏡像,同時(shí)對(duì)不能識(shí)別的壞盤(pán)進(jìn)行檢測(cè)。
首先將壞盤(pán)連接到外部的SAS擴(kuò)展卡上,加電后通過(guò)硬盤(pán)工作聲音判斷硬盤(pán)電機(jī)能夠起轉(zhuǎn),但是磁頭沒(méi)有進(jìn)行尋道操作,于是嘗試把硬盤(pán)PCB分離下來(lái)對(duì)HDA組件氧化部分進(jìn)行清潔操作,將PCB還原后故障依舊。于是和客戶(hù)溝通使用6號(hào)熱備盤(pán)的好PCB替換到故障盤(pán)上進(jìn)行嘗試性修復(fù),再將故障盤(pán)PCB上的ROM芯片替換到6號(hào)盤(pán)的好PCB上面后硬盤(pán)工作時(shí)起轉(zhuǎn)和磁頭尋道聲音都正常,但是在尋道結(jié)束后,有明顯的敲盤(pán)聲音,于是判斷有可能磁頭損壞。在和用戶(hù)溝通后嘗試使用6號(hào)熱備盤(pán)中的好磁頭對(duì)故障盤(pán)進(jìn)行替換操作以讀取數(shù)據(jù)。在無(wú)塵室對(duì)故障盤(pán)進(jìn)行開(kāi)盤(pán)更換磁頭操作后,將故障盤(pán)連接到專(zhuān)業(yè)硬盤(pán)維修工作上進(jìn)行檢測(cè),發(fā)現(xiàn)故障盤(pán)已經(jīng)不能識(shí)別,數(shù)據(jù)無(wú)法讀取。
因?yàn)橛脩?hù)有兩塊故障盤(pán),之前嘗試修復(fù)的都是其中一塊,再次和客戶(hù)溝通嘗試對(duì)另一塊故障盤(pán)進(jìn)行修復(fù)操作。和先前的故障盤(pán)一樣,這塊盤(pán)的故障依舊是磁頭損壞,因?yàn)橛脩?hù)的
HP OEM盤(pán)價(jià)格昂貴,于是嘗試在網(wǎng)上購(gòu)買(mǎi)ST原廠(chǎng)的相同型號(hào)硬盤(pán)進(jìn)行磁頭更換。這塊硬盤(pán)的磁頭更換完成后,設(shè)備能夠正常識(shí)別硬盤(pán),于是將故障盤(pán)所有扇區(qū)完整鏡像到一塊相同容量的備份盤(pán)中。
3.重組RAID-5
步驟【判斷起始扇區(qū)】所有硬盤(pán)都鏡像好后就可以重組了,用WinHex打開(kāi)9塊盤(pán)(熱備盤(pán)不需要加進(jìn)去重組),先把鏡像文件解析成磁盤(pán)??梢钥吹竭@9塊盤(pán)的0扇區(qū)都有“55 AA”標(biāo)志,如圖1所示。

圖1
查找結(jié)果如圖2所示,0x01C2H處表示該分區(qū)的類(lèi)型,這里顯示“05”,代表這是一個(gè)擴(kuò)展分區(qū)。因此從0扇區(qū)看這是一個(gè)不正常的MBR分區(qū)結(jié)構(gòu)。
圖2
按圖1方式繼續(xù)往下找,分別在9號(hào)盤(pán)和8號(hào)盤(pán)找到了“55 AA”的標(biāo)志。9號(hào)盤(pán)查詢(xún)結(jié)果如圖3所示。這是一個(gè)正常的MBR分區(qū),其0x01C6處數(shù)值代表指向的下一個(gè)扇區(qū)為GPT的頭部。
圖3
8號(hào)盤(pán)查詢(xún)結(jié)果如圖4所示。其0x01C6處數(shù)值代表指向下一個(gè)扇區(qū)。但是下一個(gè)扇區(qū)很明顯不是GPT的頭部。
圖4
由此可以確定9號(hào)盤(pán)是第一塊盤(pán),8號(hào)盤(pán)可能是最后一塊盤(pán)。GPT分區(qū)所在扇區(qū)起始于172032扇區(qū),因此初步確定LUN的起始扇區(qū)是172032扇區(qū)。
【判斷條帶(stripe)大小】條帶也稱(chēng)塊,它是RAID處理數(shù)據(jù)的基本單元。不同的RAID其條帶大小有所不同。RAID-5的1個(gè)條帶組中有1個(gè)校驗(yàn)區(qū),1個(gè)校驗(yàn)區(qū)的大小等于1個(gè)條帶的大小,根據(jù)這一點(diǎn),針對(duì)這個(gè)RAID-5案例做分析。如果對(duì)VMFS的文件系統(tǒng)不熟悉,可以通過(guò)比較法確定條帶大小。如某一條帶組中的校驗(yàn)區(qū)跟這一條帶組中的非校驗(yàn)區(qū)可能相差的很明顯,通過(guò)WinHex查看并做對(duì)比,就可以找到條帶大小。
本案例判斷出一個(gè)條帶是1024個(gè)扇區(qū)。
【判斷RAID-5成員盤(pán)盤(pán)序】按照1024扇區(qū)分割,使一個(gè)記錄為一個(gè)條帶的大小,如圖5所示。并且9塊盤(pán)跳到同一記錄283123。
圖5
當(dāng)9塊盤(pán)都定位到同一位置時(shí),通過(guò)對(duì)比可以判斷校驗(yàn)區(qū)的走向,繼而判斷整個(gè)RAID-5的走向。之前已經(jīng)判斷出9號(hào)盤(pán)是第一塊盤(pán)了,把9號(hào)盤(pán)放在第一個(gè)位置,接著就可以判斷走向了,結(jié)果如圖6所示(drive9是第4塊盤(pán))。確定RAID-5為左走向,盤(pán)序?yàn)?,2,3,4,10,1,7,8,5。
圖6
前面內(nèi)容初步確定了LUN的起始扇區(qū)是172032扇區(qū)。用WinHex跳到172032扇區(qū),觀(guān)察各硬盤(pán)實(shí)際情況。如果172032扇區(qū)是LUN的起始扇區(qū),那么這個(gè)扇區(qū)所屬條帶中的5號(hào)盤(pán)應(yīng)該是校驗(yàn)區(qū),但是此條帶中卻顯示8號(hào)盤(pán)是檢驗(yàn)區(qū),根據(jù)本案例RAID-5的左走向,5號(hào)盤(pán)的校驗(yàn)區(qū)應(yīng)該在172032-1024=171008扇區(qū),即上一個(gè)條帶。跳轉(zhuǎn)到171008扇區(qū),發(fā)現(xiàn)校驗(yàn)區(qū)為5號(hào)盤(pán)。因此可以確定LUN的起始扇區(qū)為171008扇區(qū)。
【重組RAID-5】使用專(zhuān)業(yè)恢復(fù)工具按照確定的盤(pán)序組好,添加進(jìn)去,如圖7所示。選擇RAID-5,Stripe size 512KB,左異步。
圖7
點(diǎn)擊Build進(jìn)行重組。組好后,由于數(shù)據(jù)從1024*8=8192個(gè)扇區(qū)開(kāi)始,若專(zhuān)業(yè)恢復(fù)工具沒(méi)有跳轉(zhuǎn)到此扇區(qū)的功能,那么剛組好的RAID必須和一個(gè)文件再進(jìn)行一次Build重組操作。RAID的起始扇區(qū)(Start sectors)選擇8192,這個(gè)文件可以任意選擇起始扇區(qū)和大小大小(Count sectors),如圖8和圖9所示,圖10是組好的RAID-5。
圖8
圖9
圖10
4.移交數(shù)據(jù)
整個(gè)RAID-5就重建好后,由我公司商務(wù)聯(lián)系用戶(hù)方驗(yàn)收數(shù)據(jù),用戶(hù)方確定數(shù)據(jù)沒(méi)問(wèn)題,簽訂完驗(yàn)收合同后,完整的RAID-5數(shù)據(jù)即可移交。移交時(shí)根據(jù)用戶(hù)方要求把數(shù)據(jù)移交到用戶(hù)方帶來(lái)的新盤(pán)上?;謴?fù)完的數(shù)據(jù)保留在我公司服務(wù)器上3天,之后數(shù)據(jù)自動(dòng)被系統(tǒng)銷(xiāo)毀。
相關(guān)文章

固態(tài)硬盤(pán)該選UEFI還是Legacy? 一文講透UEFI和Legacy的區(qū)別
今天我就帶著大家深入了解一下Legacy與UEFI兩種格式的區(qū)別,以及如何查詢(xún)自己的電腦硬盤(pán)格式,下面我們分開(kāi)一一講解2025-04-23
讓移動(dòng)硬盤(pán)的傳輸速度突破6000MB/s! 雷孜小金剛SSD Pro5全面測(cè)評(píng)
性能“怪獸”來(lái)了!雷孜小金剛移動(dòng)固態(tài)Rugged SSD Pro5正式登場(chǎng),亮眼藍(lán)色全包圍保護(hù)外殼、軍工級(jí)防護(hù)搭配雷電5接口,標(biāo)稱(chēng)6700MB/s讀取速度以及5300MB/s寫(xiě)入速度,這硬核配2025-03-25
固態(tài)移動(dòng)硬盤(pán)怎么選? 2025年移動(dòng)固態(tài)硬盤(pán)選購(gòu)?fù)扑]
固態(tài)移動(dòng)硬盤(pán)已經(jīng)成為了許多人的必備品,不僅方便攜帶,還能大大提升存儲(chǔ)效率,那么,面對(duì)市場(chǎng)上琳瑯滿(mǎn)目的固態(tài)移動(dòng)硬盤(pán),我們到底該怎么選呢?今天就來(lái)跟大家分享一些選購(gòu)2025-03-25
Lexar 雷克沙NM1090 SSD測(cè)評(píng)!12000MB/s讀速的PCIe 5.0炫彩重鎧戰(zhàn)士
近期我們就體驗(yàn)了Lexar雷克沙推出的PCIe5.0固態(tài)硬盤(pán)NM1090,它初次亮相于2023年科隆游戲展,這款固態(tài)硬盤(pán)值得購(gòu)買(mǎi)嗎?詳細(xì)請(qǐng)看下文介紹2025-03-19
滿(mǎn)血性能不超過(guò)62度! Lexar 雷克沙NM1090 PRO 2TB固態(tài)硬盤(pán)測(cè)評(píng)
雷克沙(Lexar)攜旗下全產(chǎn)品矩陣及技術(shù)解決方案亮相,其中帶來(lái)了新一代旗艦級(jí)PCIe 5.0 SSD:NM1090 PRO,這款固態(tài)硬盤(pán)性能如何?詳細(xì)請(qǐng)看下文介紹2025-03-19
華南金牌NAS升級(jí)版上市:N150處理器+萬(wàn)兆三網(wǎng)口
華南金牌昨日推出了一款“NAS 升級(jí)版”,暫未上架京東,淘寶店顯示 8GB 內(nèi)存版本 2399 元,雙 4T 硬盤(pán)版本 3699 元,四 4T 版本 4899 元,詳細(xì)配置如下2025-03-14
重新定義入門(mén)級(jí)SSD! 佰維M350 PCIe4.0 2TB固態(tài)硬盤(pán)測(cè)評(píng)
最近一陣子,固態(tài)硬盤(pán)的價(jià)格算是比較穩(wěn)定了,而現(xiàn)在的很多應(yīng)用場(chǎng)景,對(duì)硬盤(pán)的需求也與日俱增,比如DeepSeek本地部署,3A游戲大作,以及像我經(jīng)常錄高清游戲?qū)崨r視頻并后期剪2025-03-14
據(jù)說(shuō)是U盤(pán)性能天花板? 移速極夜NT10雙接口固態(tài)U盤(pán)測(cè)評(píng)
于有性能+容量雙重要求的用戶(hù)來(lái)說(shuō),固態(tài)U盤(pán)已經(jīng)成為更合適的選擇,特別是目前我在用的這款移速的雙接口NT10固態(tài)U盤(pán),不僅做工精致小巧,配合我的主力PC電腦上的USB 3.2 Gen2025-03-04
鎧俠極至光速VD10 PCIe5.0固態(tài)硬盤(pán)測(cè)評(píng):10000MB/s極速狂飆
2025年開(kāi)年,鎧俠率先推出了一款性?xún)r(jià)比超高的PCIe5.0固態(tài)硬盤(pán)——極至光速VD10,1TB到手價(jià)僅799元,下面就讓我們一起體驗(yàn)一下這款讀取速度高達(dá)10000MB/s固態(tài)硬盤(pán)的實(shí)際魅力2025-03-03
希捷睿翼桌面硬盤(pán)深度測(cè)評(píng): 海量空間數(shù)據(jù)任你存
如果你正在尋找一款性?xún)r(jià)比高的桌面硬盤(pán),希捷的產(chǎn)品或許可以納入你的考慮范圍,接下來(lái),我將為大家介紹幾款在市場(chǎng)上表現(xiàn)不錯(cuò)的希捷型號(hào),希望能為你的選擇提供一些幫助2025-03-01











