服務器數據恢復環境&故障:
某公司一臺存儲設備存放公司內部重要文件。存儲設備上有一組由6塊硬盤組成的raid5磁盤陣列。存儲設備在正常運行過程中突然崩潰,管理員強制重啟后無法找到存儲設備,多次重啟后還是找不到存儲設備。
服務器故障分析:
經過數據恢復工程師和硬件工程師團隊的檢測和分析,初步判斷這臺存儲設備故障原因應該是raid模塊損壞。raid模塊損壞故障包括raid信息丟失和raid模塊硬件損壞。基于以往大量的案例經驗,北亞企安數據恢復工程師團隊判斷該存儲設備故障極有可能就是設備多次異常斷電導致的。經過與用戶方管理員的溝通得知這臺存儲在出現故障之前確實遭遇過數次非正常的斷電關機,但每次斷電后重啟一切正常,因此未引起管理員的注意。即使存儲設備崩潰后也沒有意識到這次故障與以前設備多次異常斷電有關系。
服務器數據恢復過程:
1、由硬件工程師對故障存儲中所有硬盤做物理故障檢測,經過檢測沒有發現所有硬盤都可以正常讀取,不存在物理故障。
2、將所有硬盤以只讀方式做完整鏡像備份,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免在數據恢復過程中對原始數據造成二次破壞。
3、基于鏡像文件分析故障存儲中的raid5磁盤陣列的raid結構,獲取所有硬盤在陣列中的盤序、校驗方式和數據塊大小等raid相關信息。利用這些raid相關重新構建一組raid5陣列。
4、對重構的raid5陣列進行邏輯校驗,邏輯校驗成功后讓用戶方工程師親自進行數據驗證。
5、經過用戶方工程師的反復驗證,沒有發現任何問題,確認恢復出來的數據完整可用,用戶方對數據恢復結果十分滿意,本次數據恢復任務完成。
服務器數據安全Tips:
1、服務器和存儲設備所在的機房應該盡量保障電源供應的穩定,如果有設備確實需要關機,一定要使用正確的關機方法關機,而不是直接斷電。
2、使用年限比較長的一些老設備要經常檢查,尤其是對“受過傷害”但依舊在運行的設備格外留意,隨時注意其工作狀態,發現問題及時處理。例如本案例中的存儲設備,多次異常斷電后并沒有馬上出現故障而是運行了一段時間后才突然崩潰。
3、做好數據備份,有了備份文件,就算是設備崩潰了也可以盡量減少損失,降低對正常業務的影響。
審核編輯黃宇
-
服務器
+關注
關注
13文章
9735瀏覽量
87490 -
數據恢復
+關注
關注
10文章
642瀏覽量
18070
發布評論請先 登錄
服務器數據恢復—Linux系統服務器崩潰的數據恢復案例
服務器數據恢復—raid5陣列中硬盤壞道導致陣列崩潰的數據恢復案例

服務器數據恢復—Raid5陣列熱備盤上線失敗的數據恢復案例
服務器數據恢復—raid5陣列崩潰導致上層lun無法正常使用的數據恢復案例

服務器數據恢復—華為OceanStor存儲中RAID5陣列數據恢復案例

服務器數據恢復—用5盤RAID5陣列中的4塊盤重建RAID5陣列后如何恢復原始數據?
服務器數據恢復—RAID5陣列硬盤離線但熱備盤未激活的數據恢復案例

評論