服務器數據恢復環境:
某品牌EVA某型號存儲,底層是RAID5陣列,劃分了若干lun。
服務器故障&分析:
該存儲設備中raid5陣列有兩塊硬盤掉線,存儲中的lun丟失。
將故障服務器存儲中的所有磁盤編號后取出,硬件工程師檢測后發現掉線硬盤不存在物理故障,也沒有發現壞道,都可以正常讀取數據。
掉線硬盤經過檢測沒有發現有物理故障,可以初步判斷硬盤掉線是因為硬盤讀寫不穩定,本案例中EVA存儲中所采用的raid控制器通常會將讀寫不穩定的硬盤判斷為壞盤并踢出陣列。由于raid5的特性,掉線硬盤超過了2塊后就會導致陣列崩潰。
EVA存儲中每個LUN都有一份LUN_MAP,EVA存儲將LUN_MAP分別存放在不同的磁盤中,通過一個索引來指定其位置。因此在每個磁盤中找這個指向LUN_MAP的索引就可以找到LUN的信息了。
服務器數據恢復過程:
1、將故障存儲中所有磁盤以只讀模式進行扇區級的全盤鏡像,鏡像完成后將所有磁盤按照編號還原到原存儲中。后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
2、基于鏡像文件分析硬盤底層數據。由于LUN的RAID結構是RAID5,只需要將一個LUN的RAID條目通過RAID5的校驗算法算出校驗值,再和原有的校驗值進行比較就可以判斷這個條目中是否有掉線盤。將一個LUN的所有LUN_MAP都校驗一遍就可以知道這個LUN中有哪些RAID條目中有掉線盤,在RAID條目中都存在的盤一定就是掉線盤。剔除掉掉線盤后就可以根據LUN_MAP恢復所有LUN的數據。
3、北亞企安數據恢復工程師編寫掃描程序掃描LUN_MAP,結合人工分析找到正確的LUN_MAP。
4、北亞企安數據恢復工程師編寫RAID條目檢測程序檢測所有LUN中掉線的磁盤,結合人工分析排除掉線磁盤。
5、北亞企安數據恢復工程師編寫數據恢復程序,結合LUN_MAP恢復所有LUN數據。人工核對每個LUN,確認是否和用戶方描述的一致。
根據用戶方工程師的描述,LUN的數據分為2部分:Vmware的虛擬機和HP-UX上的裸設備。裸設備里存放的是Oracle的dbf數據庫。由于恢復的是LUN,無法看到里面的文件,因此需要人工核對哪些LUN是Vmware虛擬機,哪些LUN是HP-UX裸設備。核對完成后將不同的LUN掛載到不同的驗證環境中驗證恢復出來的數據是否完整。
6、驗證數據完整性沒有問題后,將所有存放vmware虛擬機的LUN中的虛擬機文件都提取出來,然后通過NFS共享的方式掛載到虛擬主機上。
7、通過NFS將所有虛擬機都添加到虛擬主機以后,將所有虛擬機加電開機,都能啟動系統。用戶方工程師進入到虛擬機內查看數據,經過驗證確認虛擬機內的數據沒有問題,確認恢復出來的數據完整有效。本次數據恢復工作完成。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9335瀏覽量
86134 -
數據恢復
+關注
關注
10文章
587瀏覽量
17662
發布評論請先 登錄
相關推薦
評論