強大的資料重複刪除技術(Data Deduplication) for Windows Server 2012
Windows Server 2012目前已經釋出RTM版本了,日前參加微軟的Tech.Days 2012活動也看到了許多令人驚豔的技術,在Windows Server 2012產品理,除了Hyper-V 3.0外,最讓我感到好奇的就是資料重複刪除技術(Data Deduplication) ,在啟用重複刪除磁區裡,若遇到有相同檔案時系統只會計算一份資料量,這對於伺服器管理將有更多更有效的應用。
根據微軟線上文件提供的資料,使用上有幾點限制:
伺服器:
- 伺服器硬體必須符合執行 Windows Server® 2012 的最低需求。重複資料刪除功能的設計可以支援最低組態,如 4 GB RAM 的單個處理器系統以及一個 SATA 硬碟。
- 如果您計畫支援刪除同一部伺服器上多個磁碟區的重複資料,就需要適當地調整系統的大小,以確保它可以處理資料。一般的規則是伺服器需要 1 個 CPU 核心以及 350MB 的可用記憶體,以便在單個磁碟區上執行重複資料刪除的工作,而這項工作每天可以處理 1.5 TB 的資料。
例如,如果您的伺服器配備了 16 CPU 核心及 16GB 的記憶體,那麼重複資料刪除在預設的背景處理模式下會使用 25% 的系統記憶體,在這個例子中,也就是使用 4GB。如果除以 350MB,就可以計算出伺服器一次大約可以處理 11 個磁碟區。 如果新增 8GB 的記憶體,系統一次就可以處理 17 個磁碟區。如果設定最佳化工作在輸出量模式下執行,系統最多會將系統記憶體的 50% 用於最佳化工作。 - 雖然重複資料刪除功能一次最多可以支援 90 個磁碟區,不過,其實每個實體 CPU 核心只能同時處理一個磁碟區的重複資料刪除,再加一個。超執行緒對它沒有影響,因為只有實體核心會可以用來處理磁碟區。配備 16 CPU 核心及 90 個磁碟區的系統,一次將會處理 17 磁碟區,直到處理完全部的 90 個磁碟區為止。
- 虛擬伺服器執行個體在使用伺服器的資源時,必須遵循與實體硬體相同的指導原則。
磁碟區:
作為重複資料刪除候選項的磁碟區必須遵守下列需求:
- 必須不是系統或開機磁碟區。作業系統磁碟區不支援刪除重複資料。
- 磁碟區必須以 MBR 或 GPT 分割,而且必須使用 NTFS 檔案系統格式化。
- 磁碟區可以位於共用儲存區,如光纖通道或 SAS 陣列,或完全支援的 iSCSI SAN 與 Microsoft 容錯移轉叢集。
- 不支援叢集共用磁碟區 (CSV)。
- 不支援 Microsoft 新的彈性檔案系統 (ReFS)。
- 磁碟區必須在 Windows 中顯示為非卸除式磁碟機。不支援遠端對應磁碟機。
要使用這項技術,必須先在伺服器角色內的檔案和存取服務 \ 檔案和iSCSI服務 \ 刪除重複技術給安裝起來

接著再到檔案和存取服務裡面 \ 磁碟區 \ 目標磁碟去設定重複資料刪除

接著只要把啟用重複資料刪除給啟動即可,但有一個很重要的地方,由於
,若你在測試或是想要很快看到結果,可以跟我一樣調整成1天 (然後馬上日期調到幾天後,然後執行排程即可看到結果,測試環境限定專用)

設定完成後,接下來就可以測試看看重複刪除的效果,我在E磁碟機內塞了四個同樣大小的檔案,系統統計的結果是14.5G

由於預設重複刪除功能是執行排程,為了及早看到效果,可以直接去排程內執行該隻工作

跑完之後可以看到,雖然檔案容量一樣是14.5G,但是在2012系統裡面卻是刪除了79%的重複量,只計算3.6G使用量而已

從上面的例子可以看到,Windows Server 2012的重複刪除技術真的很威,可以有效的管理硬碟容量,從此以後再也不用擔心檔案亂塞會讓硬碟爆掉了(誤)~~~