raid5陣列常見故障:
1、服務器硬件故障或者RAID陣列卡故障;
2、服務器意外斷電導致的磁盤陣列故障;
3、服務器RAID陣列陣列磁盤出現物理故障,如:電路板壞、磁頭損壞、盤面劃傷、壞扇區、固件壞等;
4、誤操作導致磁盤盤序出現錯誤;
5、raid在同步數據或者重建過程中,同組raid陣列中又有其他硬盤掉線導致同步失敗。
RAID5磁盤陣列出現故障后需要注意的問題:
1、發現RAID5磁盤陣列發生故障或者數據丟失,建議不要盲目進行rebuild操作。
Rebuild:通過陣列的校驗功能,根據陣列內其他正常硬盤中的數據,計算&生成損壞硬盤中的數據,然后同步到熱備盤中。Rebuild操作適用于raid5陣列中有1塊硬盤掉線的情況。針對raid5陣列中有2塊磁盤掉線的情況:如果第一塊硬盤掉線后服務器有寫入操作,第一塊掉線的硬盤數據在掉線后就不更新了。rebuild只能對先掉線的磁盤做Rebuild,如果對后掉線的磁盤做Rebuild操作,則部分陣列雖然能正常工作,但會出現數據錯亂,某些文件無法打開的情況。
2、RAID5陣列中硬盤掉線,建議不要盲目進行強制上線操作。
從北亞企安數據恢復工程師做過的海量RAID5陣列數據恢復案例中來看,有部分raid5陣列數據丟失的原因是陣列中有一塊硬盤離線后沒有及時更換硬盤,此后服務器出現故障或者服務器重啟,原來離線的硬盤重新上線,而原本在線的硬盤反而故障離線,數據不能正常使用。
用戶對后離線的硬盤進行強制上線操作,磁盤陣列自動同步,導致數據新舊混亂,服務器數據丟失。市面上多數品牌和型號的陣列卡在原先離線磁盤自動上線時會檢查校驗信息,一旦發現校驗信息不正確就會重新計算校驗信息,無法在缺盤的情況下恢復數據。
3、千萬不要進行初始化操作。
初始化類似于低級格式化,一旦對陣列進行初始化操作,這個陣列內所有硬盤的底層數據會被全部清零,導致陣列數據無法恢復。
4、重新配置陣列信息時要保持與原陣列配置信息一致。
一旦重新配置磁盤陣列的信息與原始磁盤陣列的信息不一致,陣列內多數文件將無法打開,導致數據丟失。多數服務器都具有重新配置陣列信息后自動初始化的功能,這將導致數據無法恢復。
5、在進行任何數據恢復操作前,務必將服務器內的所有硬盤以只讀方式進行扇區級的鏡像備份,避免破壞原始數據。
RAID5數據恢復方案:
1、將故障服務器中所有磁盤編號后取出,由硬件工程師對所有磁盤進行硬件故障檢測。針對不存在硬件故障的磁盤,以只讀方式做鏡像;對于存在硬件故障的磁盤,由硬件工程師處理后使用專門的工具做鏡像備份。
2、基于鏡像文件分析底層數據,根據分析底層數據獲取到的RAID5陣列結構相關信息重組raid5陣列,然后導出數據。
3、驗證導出的數據,確認數據無誤后重新搭建環境,將恢復出來的數據遷移到準備好的服務器環境中。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9304瀏覽量
86062 -
數據恢復
+關注
關注
10文章
585瀏覽量
17632 -
RAID5
+關注
關注
0文章
122瀏覽量
12767
發布評論請先 登錄
相關推薦
評論