服務器數據恢復環境:
EMC存儲,多塊stat硬盤組建raid5磁盤陣列,兩塊熱備盤,上層采用zfs文件系統。
服務器故障&檢測&分析:
EMC存儲中的raid5磁盤陣列有2塊硬盤出現故障,但是只有一塊熱備盤被激活,raid5磁盤陣列崩潰,存儲不可用。
服務器數據恢復工程師前往現場對故障存儲設備進行檢測。經過簡單排查后確認raid5陣列癱瘓,上層lun無法使用,2塊熱備盤只有一塊啟動。
硬件工程師對掉線硬盤進行物理故障檢測,均未檢測到壞道,磁頭也不存在物理故障。在進行數據恢復之前不需要進行物理修復。
服務器數據恢復過程:
1、在恢復數據之前將故障存儲設備上的所有數據以只讀方式鏡像備份。
2、服務器數據恢復工程師基于鏡像備份文件分析故障raid5中的每塊硬盤底層數據,發現兩塊熱備盤內沒有任何數據,也就是說被激活的那塊熱備盤也沒有同步到任何數據,故障raid5磁盤陣列中的兩塊熱備盤在磁盤離線后沒有起到任何作用。想要恢復數據需要通過分析獲取到該raid5磁盤陣列的相關信息來重組raid5。
3、服務器數據恢復工程師使用北亞企安自主研發的服務器數據恢復工具解析出該組raid5磁盤陣列的基礎信息,根據這些信息虛擬重組raid5磁盤陣列。
*將有多塊硬盤掉線的磁盤陣列中最早掉線的那塊硬盤從陣列中剔除,比對每塊硬盤在同一個條帶上的數據是否一致,將同一個條帶上數據明顯不同的硬盤剔除后進行條帶校驗,直至找到數據恢復的最佳狀態為止。
4、重組raid5陣列后,服務器數據恢復工程師分析lun信息,然后使用自主開發的程序解析和導出lun數據的map。
5、使用北亞企安自主開發的程序解析和恢復上層的文件系統。該故障存儲設備上層采用的是zfs文件系統,服務器數據恢復工程師解析文件系統時發現部分文件系統元文件報錯,數據恢復工程師對自主開發的程序進行debug調試,讓程序適應本案例數據恢復的需求。
6、經過調試發現,導致zfs文件系統解析報錯的原因是由于存儲設備的突然癱瘓導致zfs文件系統中某些元文件被破壞,導致無法正常解析。服務器數據恢復工程師對損壞的元文件進行手工修復,保障zfs文件系統可以正常解析。
7、zfs文件系統解析完成后,服務器數據恢復工程師將故障raid5陣列內的數據完整導出,由用戶方工程師搭建數據驗證環境,對恢復出來的數據進行驗證。經過反復驗證,用戶原服務器內的所有數據均完全恢復。
審核編輯:湯梓紅
-
服務器
+關注
關注
13文章
9717瀏覽量
87368 -
數據恢復
+關注
關注
10文章
640瀏覽量
18035 -
RAID5
+關注
關注
0文章
130瀏覽量
12985
發布評論請先 登錄
評論