幫助中心
技術(shù)運維百科
raid5故障檢測恢復(fù)
2017-11-16 14:40:31

故障描述:

磁盤陣列出現(xiàn)問題,內(nèi)置硬盤搭建的RAID5陣列。一開始有一塊硬盤離線,在更換新硬盤進行同步的過程中,第二塊磁盤指示燈報警,同步失敗,陣列無法正常工作。

初步檢測:

存儲介質(zhì)物理狀態(tài):最先離線的硬盤訪問速度極其緩慢,第二塊離線的磁盤有少量壞扇區(qū),其他磁盤無明顯物理問題。

存儲介質(zhì)邏輯狀況:整個陣列只包含一個卷組,該卷組占用陣列全部空間;并且該卷組只有一個起始位置為0扇區(qū)的XFS裸分區(qū)。

故障分析:

RAID5陣列架構(gòu)在設(shè)計上只支持一塊磁盤的錯誤冗余功能,當?shù)诙K磁盤離線后陣列便無法正常工作。

根據(jù)用戶描述可知,整個陣列的崩潰主要由第二塊磁盤造成。所以第二塊磁盤的處理是此次恢復(fù)的關(guān)鍵

恢復(fù)過程:

1、對所有硬盤做只讀鏡像的備份,單獨備份第二塊離線的硬盤,備份過程中略過壞扇區(qū)。

2、對硬盤鏡像文件進行異或測試,全部通過,無明顯錯誤。

3、計算第二塊硬盤損壞扇區(qū)位置的數(shù)據(jù),并將其寫入鏡像文件。

4、在備份過程中同時分析原RAID組成結(jié)構(gòu),構(gòu)建虛擬RAID環(huán)境。

5、驗證RAID結(jié)構(gòu)是否正確。

6、將第二塊磁盤的鏡像備份到新硬盤,并將其強制上線,更換第一塊磁盤,并對其進行同步。(注意:在操作之前要對所有硬盤進行備份)

7、拷貝數(shù)據(jù)。

結(jié)論:

因為異或測試完全通過,所以表明該存儲發(fā)生故障后沒有新數(shù)據(jù)寫入,或結(jié)構(gòu)改動。

所以可以根據(jù)其他幾塊好硬盤計算出壞硬盤對應(yīng)位置的數(shù)據(jù)。

恢復(fù)完成后,目錄結(jié)構(gòu)完整,重要文檔全部完好。FSCK無任何錯誤提示,恢復(fù)成功。

新客優(yōu)惠
特價 酷睿i3系列
性價比熱銷推薦,年銷量第一
1180/月起
USA-IDC為您提供免備案服務(wù)器 0元試用
立即聯(lián)系在線客服,即可申請免費產(chǎn)品試用服務(wù)
立即申請