以文本方式查看主題 - 安易免費財務軟件交流論壇 (http://m.gangyx.cn/bbs/index.asp) -- 電腦知識交流 (http://m.gangyx.cn/bbs/list.asp?boardid=11) ---- 虛擬磁帶庫的新生(2) (http://m.gangyx.cn/bbs/dispbbs.asp?boardid=11&id=32417) |
-- 作者:炙天 -- 發布時間:2011/1/13 11:05:48 -- 虛擬磁帶庫的新生(2) 技術篇:發揮磁盤管理優勢 虛擬文件系統 如前文所述,在使用時,VTL可以被看作是一個機械磁帶庫,兩者的工作流程可以完全一致。然而,這樣做僅僅是對傳統磁帶庫的模擬,還沒有發揮磁盤在數據管理工作中的靈活性。因此,用戶還希望VTL在數據管理中充分發揮類似在線設備那樣的優勢。虛擬文件系統便是這樣一種技術。 眾所周知,磁帶是一種順序的塊級設備:一方面在數據讀寫方面都必須“順序”到達指定位置才能操作;另一方面塊級數據沒有文件的概念,在恢復數據時只有完全恢復整盤磁帶才能獲得特定的文件。 虛擬文件系統通過一個NFS/CIFS界面可以把相同的文件列表作為一個虛擬文件系統展示出來。該文件系統甚至可以被安裝用以讀/寫訪問,允許用戶立刻使用備份的文件系統從一文件系統備份即時恢復。虛擬文件系統的所有變化會被記錄下來,并且以一種增量備份展現給備份軟件。一旦真正的文件系統被恢復,可以使用備份軟件將虛擬文件系統的改動恢復到原始卷。 如此一來,用戶可以通過使用虛擬文件系統恢復特定的文件,而無須像傳統恢復過程中那樣恢復整盤虛擬磁帶。 重復數據刪除 重復數據刪除技術同樣利用了磁盤的管理優勢。它主要應用在VTL中,因為在傳統磁帶中是無法實現重復數據刪除的。企業戰略集團創始人兼分析師Steve Duplessie說:“重復數據刪除技術可能是存儲行業最重要的一項新興技術,這會讓更多數據管理和保護目標變得更切實際”。 分析家們認為,異軍突起的重復數據刪除技術,將會改寫存儲行業的經濟規則,實際存檔的數據將會呈幾何級別遞減,大幅削減存儲成本,借助于重復數據刪除技術,用戶的存檔數據所占用的空間將會縮減為現在的5%. ADIC近期以6300萬美元收購來自于澳大利亞阿德萊德(Adelaide)的重復數據刪除軟件開發商Rocksoft Ltd.。該公司獨家專利的重復數據刪除軟件技術,可自動搜索磁盤上保存的重復文件副本,并使用指向單一副本的指針替換掉其它重復副本;萬一用戶對重復副本的內容做了修改,那么,該軟件將會自動為該文件創建一個可寫入的拷貝。ADIC打算將其整合到PathLight VX虛擬磁帶庫和StorNext存檔軟件內。 在HDS最新發布的VTL產品中,采用了Diligent公司的ProtecTIER VT with HyperFactor重復數據刪除技術。HDS稱,該解決方案可以從根本上將物理存儲需求降至原來的二十五分之一甚至更低。 近期, Sepaton公司宣布了其新一代的重復數據刪除技術,以及實現該技術的應用軟件DeltaStor.DeltaStor軟件可以消除無變化的數據或復制的數據,從而使用戶以很低的成本在線存儲更多的數據,在不影響備份窗口的前提下實現高效的重復數據刪除。 DeltaStor軟件的核心是Sepaton內容已知的數據庫。DeltaStor軟件使用元數據標志數據對象之間的關系,并智能地做出處理決定。 數據收集 在數據收集階段,軟件通過比較進入的備份數據和先前的備份縮小需要進行分析數據的范圍,使用“內容已知”數據庫辨別它們之間可能的重復和相似數據。例如,如果名為同一個客戶端中的 “ ootdocumentsabc.txt”文件在備份中存在兩次,軟件自動決定采取何種動作。如果進入的數據是已存在數據的修改版本,該數據就進入下一階段(數據識別、數據比較)的處理流程以確定數據發生的具體變化;如果進入的數據和已存在數據完全相同,那么進入下一階段對數據副本進行校驗。另外的數據收集操作包括: 標志保存在不同位置(例如,不同的客戶端、目錄等)的相同對象副本。軟件還為數據收集階段發現的冗余數據對創建一工作列表,該表格用于數據識別和比較階段進行進一步分析。 數據識別/數據比較 在數據識別/數據比較階段,軟件以字節為單位分析數據收集階段標志出的相似數據對象。如果數據收集階段創建的工作表表明需要進行數據識別,那么軟件就會用 delta 差分算法確定備份組中的哪些數據是唯一的、哪些數據是重復的。 該算法可以有效地以字節為單位映射發生變化的數據,并且對數據對象內的偏移或者位置改變不敏感,所以,即使相關的對象之間發生明顯的結構改變,該算法仍可以定位冗余的數據。 如果數據收集階段從元數據級別認定備份組中的數據和前一個備份相同,那么在數據識別階段將以字節為單位對數據進行比較。在該步驟中,軟件調用數據比較器識別出數據發生變化的文件。 數據重組 數據識別/數據比較的結果被傳遞給數據重組過程,在該過程中數據被重新組裝,放入臨時的“保留磁帶”中,新數據被保存,前一階段被標出的重復數據被已存數據的指針替代。對備份軟件而言,保留磁帶和真正的磁帶完全相同,只是存儲在新磁帶中的數據要遠少于真正的磁帶上存儲的數據。從備份軟件看來,數據是連續的并且也沒有刪除副本, 軟件可以根據嵌入在文件系統中的指針讀取重復數據的唯一一份副本。該過程的最終結果是產生一份經過重復數據刪除的備份組視圖。 可選的完整性檢查 在實際刪除所有的重復數據前,軟件執行一次可選的檢查,以保證數據100%的完整性。在本階段中,軟件通過將“保留磁帶”(代表經過重復數據刪除的數據)和原始數據進行比較驗證其結構和整個數據內容。 空間回收 在空間回收階段,軟件從文件系統中刪除冗余的數據,釋放先前被占用的磁盤空間以備他用。保留磁帶和原始的、沒有經過重復數據刪除的磁帶交換位置(比如條碼、槽位以及屬性等),然后軟件智能的釋放重復的區塊并將它們放回空閑空間池。經過這樣的處理以后,所有其他需要存儲空間的數據處理過程都可以重用先前被重復數據占用的空間。 |