パターンの検出および削除

パターンの検出と削除は、データ削減プロセスの最初のステージです。

パターン・マッチング・メカニズムは、着信するホスト書き込みをシステムに保管されている事前構成済みの既知のパターンのセットと突き合わせます。次の図に示すように、書き込みは、処理されると、8 KB のブロックに分割されます。

図 1. パターンの検出および削除
 パターンの検出および削除

その後、各ブロックはハッシュされ、フィンガープリントとも呼ばれるハッシュ値は既知のハッシュの表と比較されます。一致が検出された場合は、わずか 2 バイトの対応するパターン ID が保管されます。このステージで検出された一致はすべて、内部マーキング (ハッシュ) に置き換えられます。