服務器數據恢復環境:
某品牌2850服務器上有一組由6塊SCSI硬盤組建的raid5磁盤陣列,上層操作系統為Redhat linux+ext3文件系統。
服務器故障&初檢:
服務器在運行過程中突然癱瘓,管理員對服務器中的raid進行檢查后發現有兩塊硬盤離線。管理員對其中一塊離線硬盤進行強制上線操作,但是強制上線操作完成后操作系統啟動異常。管理員馬上將服務器關機,聯系我們數據恢復中心尋求幫助。
raid5陣列出現兩塊硬盤離線的故障情況非常普遍。raid5磁盤陣列支持一塊硬盤離線時的冗余保護,一旦多塊硬盤離線,磁盤陣列便處于癱瘓狀態,且不會自動上線。
市面上絕大多數硬件廠商生產的raid控制器敏感性較強,多數硬盤掉線僅僅是因為電源波動、控制器bug等非硬盤硬件故障所導致,本案例中的情況就是如此。因為經過硬件工程師的初步檢測,沒有發現有硬盤存在物理故障。即使掉線硬盤不存在物理故障,如果此時進行強制上線的操作,風險還是很大的。一旦上線錯誤就會導致raid控制器對數據造成不可逆的破壞,進入操作系統后因為文件系統不一致會進行自動修復,進一步加大數據恢復的難度。
服務器數據恢復過程:
1、將服務器中所有硬盤以只讀方式進行扇區級全盤鏡像備份,在備份過程中發現有多塊硬盤存在壞道但沒有下線,應該是raid還沒有讀到硬盤壞道。備份完成后將所有磁盤按照原樣還原到原服務器上。
2、基于鏡像文件分析所有磁盤底層數據,獲取故障raid組成結構信息。根據獲取到的raid結構信息重組raid并進行結構驗證。
3、北亞企安數據恢復工程師手工修正被破壞的結構,將修正后的數據導出到一臺存儲上臨時存放。
4、使用完好的硬盤在服務器上搭建新的raid5磁盤陣列,將恢復出來的數據遷移到新搭建的raid中。
5、數據恢復工程師和用戶方對服務器中的數據進行檢測,發現一切正常。本次數據恢復工作結束。
服務器數據恢復結論:
一旦raid5磁盤陣列出現多塊硬盤離線、服務器癱瘓的情況切記不要盲目進行強制上線的操作。盡可能將原硬盤全部做鏡像,然后尋求專業數據恢復機構的幫助。
審核編輯 黃宇
-
服務器
+關注
關注
13文章
9749瀏覽量
87544 -
數據恢復
+關注
關注
10文章
644瀏覽量
18078 -
RAID5
+關注
關注
0文章
131瀏覽量
13012
發布評論請先 登錄
服務器數據恢復—raid5陣列多塊硬盤離線導致EMC存儲不可用的數據恢復案例
服務器數據恢復—雙循環raid5磁盤陣列數據恢復案例
服務器數據恢復—華為OceanStor存儲中RAID5陣列數據恢復案例

評論