インライン重複排除

インライン重複排除は、データをディスクに書き込む前に処理して統合する 2 番目のデータ削減ステージです。

ハッシュとハッシュ比較は処理中に実行されます。インライン重複排除のメリットは、重複したチャンクが宛先ディスク・システムに書き込まれることがない点です。

次の図は、ハッシュとメタデータを使用することによって重複排除プロセスで元のデータがどれくらい削減されるかを示しています。

図 1. 重複排除のプロセス
 重複排除のプロセス
このプロセスでは以下が行われます。
  • ハッシュは (書き込み時に) 1 回のみ計算されます
  • ハッシュはメタデータに保管されます
  • ハッシュを比較することによってデータが比較されます
  • チャンク・サイズは 8 KB ですが、4 KB アライメントもサポートされており、さらに高い重複排除率が可能です

重複排除のみを使用するデータ削減率は最大 30:1 (96.7% の節約) です