内联去重

内联去重是第二个数据降维阶段,用于在数据写入磁盘之前对其进行处理与合并。

将实时执行散列化和散列比较。 内联去重的优势在于,永远不会将重复区块写入目标磁盘系统。

下图说明如何使用散列化和元数据通过去重过程减少原始数据。

图 1. 去重过程
去重过程
在此过程中:
  • 散列仅计算一次(写入时)
  • 散列存储在元数据中
  • 通过比较散列来比较数据
  • 区块大小为 8 KB,但是也支持 4 KB 对齐,且允许更高的去重比率

仅执行去重的数据降维比率最高可达到 30:1(节省 96.7%)。