
上午接到長治一電商公司的求助電話,一臺DELL-R430,3盤1TB,安裝CentOS,在意外斷電后系統無法啟動,該機裝有公司的OA,以及營銷數據。環境為LNMP——Linux系統下Nginx+MySQL+PHP網站服務器架構,并要求上門現場服務
電話中給出恢復方案以及價格,對方跟領導請示后還是決定帶機器到我司恢復。其實到我司恢復****可以節省掉不少的上門費用,其次在數據恢復的過程中如果有其他意外情況出現都是有很好的解決方案的,比如設備、資源等,除非數據涉密!
客戶到達我司已經是下午5點了,按照標準流程:
- 對每一塊物理盤做鏡像。其目的是為了確保數據****,以及保證故障后的**原始狀態,并且在后續的系統上線工作中也是要用到原始鏡像的。
- 鏡像原盤后又分為2步同時操作,這個也是我們的優勢:
- 軟件工程師來分析鏡像文件,判斷該RAID組的排列方法,塊的大小,走向等。
- 硬件工程師用原盤上機判斷硬盤損壞狀態,結合軟件技術給出的RAID信息來剔除臟盤,做出**后一次系統正常啟動時的正確配置。
- 如系統正常啟動則數據恢復工作完成,如不能啟動則先驗證軟件工程師組出的數據是否正確
鏡像工作完成后,我們將硬盤上機啟動,首先進入RAID配置程序,顯示一個raid5卷,并且已經降級報黃,其中有一個MISS狀態,正常情況下RAID5里面有一個盤miss是可以正常啟動的,那么我們就重啟進系統看看什么問題
看到有正常的系統啟動界面,那么說明該RAID還是繼續生效中,但是他的系統是報錯了。
分析報錯信息,發現home是單獨掛載的一個lv,那么我們用一條命令來嘗試性解決它
Fsck –y
輸入該命令后經過一堆跳碼后我們reboot重啟。
這個畫面是不是有點熟悉呢?對,我們把系統修復了。配置網絡環境后,聯機查看完美
我以上所寫的這些文字用了10分鐘,實則我們整個工作完成后已經是第二天早上5點了。整12小時。正所謂“臺上十分鐘,臺下十年功”。