[點晴永久免費OA]了解服務器存儲快照原理:選擇最優的備份方案
當前位置:點晴教程→點晴OA辦公管理信息系統
→『 經驗分享&問題答疑 』
1. 什么是快照 SNIA(存儲網絡行業協會)對快照(Snapshot)的定義是:關于指定數據集合的一個完全可用拷貝,該拷貝包括相應數據在某個時間點(拷貝開始的時間點)的映像。快照可以是其所表示的數據的一個副本也可以是數據的一個復制品。 快照的價值有以下三點: 快速備份/恢復:快照可迅速生成,并可用作傳統備份和歸檔的數據源,縮小甚至消除了數據備份窗口,快照存儲在磁盤上,可以快速直接存取,大大提高數據恢復的速度。 保存多個恢復點目標:基于磁盤的快照使存儲設備有靈活和頻繁的恢復點,可以快速通過不同時間點的快照恢復數據。 重新定義數據用途:快照提供一份接近實況數據的拷貝,可供測試、歸檔、查詢使用,既保護生產系統又賦予備份數據新的用途。 根據實現方式的不同,最常用快照可以分成兩類: 寫時復制(COW:Copy On Write); 寫時重定向(ROW:Redirect On Write)。 2. 圖解COW技術 在做快照前,服務器往存儲設備寫入數據將直接覆蓋原來數據塊,如下圖所示,數據'p’寫入數據塊1中,將覆蓋原有數據'b’。 創建快照時,COW 快照需要消耗一些存儲空間建立快照卷。當我們為一個數據卷創建一個快照之后這些預留的空間用來存放被變化數據更新的舊數據。COW快照在初始化的過程中僅僅創建用來描述源數據塊位置的指針信息(元數據),而不是完整的將源數據塊拷貝過來。因此初始化的過程幾乎可以在瞬間完成,對系統的影響也很小。 COW 快照會跟蹤數據卷的寫操作和數據塊變化。當某個數據塊發生改變時,在將舊的數據覆蓋之前,首先將該塊的舊數據復制到預留的快照卷,該步驟僅在數據卷相應數據塊位置發生第一次寫操作請求時進行。這個處理過程確??煺粘鰜淼臄祿c發起快照的那個精確時間點保持完全一致。 需要注意的是,根據COW的機制,快照創建以后,如果有對原卷的數據修改,修改的數據第一次被修改的時候就把數據COPY到快照卷里。如下圖所示若塊6內容再發生變化就不會被保存,因為它們所位置的數據已經不是第一次改變。這樣做是為了保證恢復數據時能夠恢復到啟用快照時的數據狀態(即源數據卷對應位置是數據塊6內容是'g'時的狀態)。 如果需要訪問某個時間點的快照數據時將組合索引/日志和源卷,對沒有改變過的塊直接從數據卷讀取,對已經改變并被復制的塊則從快照空間讀取。從快照被創建那一刻開始,每個快照都會跟蹤記錄描述塊改變的元數據信息。 如果要恢復上一次快照點的數據,如下圖所示將讀取源卷上的數據'apcdefhi’和快照卷上的數據'g'組合成'apcdefghi'數據。由于塊1上的數據是'b’是在快照前改寫成'p’的,所以無法恢復。 3. 圖解ROW技術 在做快照前,服務器往存儲設備寫入數據將直接覆蓋原來數據塊,如下圖所示,數據'p'寫入數據塊1中,將覆蓋原有數據'b'。 創建快照時,ROW 快照需要消耗一些存儲空間建立快照卷。當為一個數據卷創建一個快照之后,這些預留的空間用來存放新寫入的數據。 ROW 快照對于原始數據卷的首次寫操作將被重定向到預留的快照空間。該快照維持的是指向所有源數據的指針和拷貝數據。當數據被重寫時,將會給更新過的數據選擇一個新的位置,同時指向該數據的指針也被重新映射,指向更新后的數據。如果拷貝是只讀的,那么指向該數據的指針就根本不會被修改。 如下圖所示新數據'z’替換'g’,源卷塊6中的'g’不變,新數據'z’直接寫入到快照空間中。 需要恢復某個時間點的快照數據時,只需讀取源卷數據即可。如下圖所示將讀取原卷上的數據'apcdefghi’。由于塊1上的數據是'b’是在快照前改寫成'p’的,所以無法恢復。 4. 對比分析 “ROW 重定向寫”與“COW 復制寫”是相對的概念,ROW可以避免兩次寫操作引起的性能損失。ROW 同COW一樣在空間利用方面效率非常高。ROW把對數據卷的寫請求重定向給了快照預留的存儲空間,而寫操作的重定向設計則把需要兩次寫才能完成的操作減少為一次寫。COW的兩次寫操作包括將舊數據寫入快照卷和在數據卷寫入新數據。而ROW只有寫入新數據一步。 COW最大的問題是對寫性能有影響。第一次修改原卷,需要復制數據,因此需要多一次讀寫的數據塊遷移過程。這會造成應用需要等待較長時間。但原卷數據的布局沒有任何改變,因此對讀性能沒有任何影響。 ROW 最大的問題是對讀性能影響比較大。ROW寫的時候性能基本沒有損耗,只是修改指針,實現效率很高。但多次讀寫后,原卷的數據就分散到各個地方,對于連續讀寫的性能不如COW。 5. 總結 兩種快照都有優劣,需要根據自身業務情況選擇最優的方案。 該文章在 2024/7/16 12:32:06 編輯過 |
關鍵字查詢
相關文章
正在查詢... |