服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
某品牌x3850 X5服務(wù)器,服務(wù)器上有一組由5塊硬盤組建的raid5陣列(包含一塊熱備盤),安裝linux操作系統(tǒng),運(yùn)行oracle數(shù)據(jù)庫(kù)。
服務(wù)器故障:
服務(wù)器上raid5陣列中兩塊硬盤由于未知故障離線,服務(wù)器數(shù)據(jù)丟失。北亞企安數(shù)據(jù)恢復(fù)中心安排服務(wù)器數(shù)據(jù)恢復(fù)工程師達(dá)到現(xiàn)場(chǎng)對(duì)故障服務(wù)器進(jìn)行初檢,發(fā)現(xiàn)raid5陣列中有兩塊硬盤處于離線狀態(tài);熱備盤未激活,經(jīng)過檢測(cè)沒有發(fā)現(xiàn)物理故障,無明顯同步表現(xiàn)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器所有磁盤編號(hào)后取出槽位,以只讀方式進(jìn)行扇區(qū)級(jí)全盤鏡像,鏡像后發(fā)現(xiàn)除了2號(hào)盤有10-20個(gè)壞扇區(qū)外其他硬盤均正常。鏡像完成后將所有磁盤按照編號(hào)還原到原服務(wù)器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析所有磁盤底層數(shù)據(jù),獲取raid5陣列的raid結(jié)構(gòu)信息如盤序、條帶大小、塊大小、循環(huán)方向、同異步以及meta區(qū)域等信息。
北亞企安數(shù)據(jù)恢復(fù)——raid5數(shù)據(jù)恢復(fù)
3、根據(jù)分析獲取的raid信息虛擬重組raid5陣列。組好raid5陣列后驗(yàn)證數(shù)據(jù),發(fā)現(xiàn)200M以上的最新壓縮包解壓無報(bào)錯(cuò)。按照該raid結(jié)構(gòu)將raid生成到一塊單盤上。將單盤接入原服務(wù)器并通過linux SystemRescueCd啟動(dòng)服務(wù)器,使用dd命令進(jìn)行全盤回寫。
4、數(shù)據(jù)回寫完成后無法進(jìn)入操作系統(tǒng),報(bào)錯(cuò)信息為:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied。北亞企安數(shù)據(jù)恢復(fù)工程師通過SystemRescueCd重啟后檢查,發(fā)現(xiàn)文件的權(quán)限、時(shí)間、大小都有明顯錯(cuò)誤,對(duì)根分區(qū)再次分析,定位出錯(cuò)的/sbin/pidof/,確定出問題的原因是2號(hào)盤有壞道。
5、使用其他盤對(duì)2號(hào)盤的損壞區(qū)域進(jìn)行xor補(bǔ)齊并重新校驗(yàn)文件系統(tǒng),依然有錯(cuò)誤。北亞企安數(shù)據(jù)恢復(fù)工程師再次對(duì)inode表進(jìn)行檢查,發(fā)現(xiàn)2號(hào)盤損壞區(qū)域有部分節(jié)點(diǎn)表現(xiàn)異常。
北亞企安數(shù)據(jù)恢復(fù)——raid5數(shù)據(jù)恢復(fù)
雖然節(jié)點(diǎn)中描述的uid還正常存在,但大小、屬性、最初的分配塊都是錯(cuò)誤的。通過日志確定原節(jié)點(diǎn)塊的節(jié)點(diǎn)信息并進(jìn)行修正,重新dd根分區(qū),執(zhí)行fsck -fn /dev/sda5/檢測(cè),結(jié)果報(bào)錯(cuò)。
北亞企安數(shù)據(jù)恢復(fù)——raid5數(shù)據(jù)恢復(fù)
6、經(jīng)過分析發(fā)現(xiàn),3號(hào)盤先離線,節(jié)點(diǎn)信息新舊交集導(dǎo)致有多個(gè)節(jié)點(diǎn)共用數(shù)據(jù)塊,于是數(shù)據(jù)恢復(fù)工程師按節(jié)點(diǎn)所屬的文件進(jìn)行區(qū)別。清除錯(cuò)誤節(jié)點(diǎn)后,再次執(zhí)行fsck -fn /dev/sda5,依然有部分位于doc目錄下的節(jié)點(diǎn)報(bào)錯(cuò)。由于不影響啟動(dòng)所以強(qiáng)行修復(fù)后重啟系統(tǒng),系統(tǒng)正常,啟動(dòng)數(shù)據(jù)庫(kù)正常。
7、由用戶方工程師對(duì)服務(wù)器數(shù)據(jù)進(jìn)行驗(yàn)證,數(shù)據(jù)正常。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9579瀏覽量
86930 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
627瀏覽量
17932 -
RAID5
+關(guān)注
關(guān)注
0文章
127瀏覽量
12933
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
服務(wù)器數(shù)據(jù)恢復(fù)—Raid5陣列熱備盤上線失敗的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列兩塊硬盤離線崩潰,數(shù)據(jù)如何起死回生?

服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列熱備盤同步數(shù)據(jù)失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列崩潰導(dǎo)致上層lun無法正常使用的數(shù)據(jù)恢復(fù)案例

RAID5數(shù)據(jù)恢復(fù)—如何重組RAID5陣列?

服務(wù)器數(shù)據(jù)恢復(fù)—Raid5陣列兩塊硬盤指示燈亮黃色的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未全部成功啟用的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線導(dǎo)致Raid5陣列熱備盤上線失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤同步失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未完全激活導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5熱備盤同步過程中硬盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列硬盤報(bào)警亮黃燈的數(shù)據(jù)恢復(fù)案例

評(píng)論