バックアップにおける重複排除

バックアップにおける重複排除の導入が増加しています。

重複排除はバックアップ領域を削除する技術として浸透しつつありますが、すべての環境において導入すべきかというと必ずしもそうではありません。


この処理は通常のバックアップに比べても、多くのリソースを使用するので、重複排除の効果があまり見込めないデータに行っても、非効率なだけです。



そのため、重複排除のメリットを享受できる環境に対しては重複排除のバックアップをおこない、そうでないものに関しては通常どおりおこなうというように選択肢を設けてデータの特性に応じた機能の選択というのが必要です。


初めて重複排除を使用した場合の流れとして、3つのファイルがあるということを前提に考えると、文書01のファイルが最初に細かくセグメント分割されるところからはじまります。

たとえば、セグメント分割をしたところ、ABCD4つのセグメントに分割された場合、この4つのセグメントとファイル情報がストレージに格納されます。次に、文書02を見てみると、文書02は文書01のファイル名を変更しただけで、中身のセグメントはすべて同じのため、セグメントは格納されず、ファイル情報だけがストレージに格納されます。



次に文書03を見てみると、文書03は文書01を編集したものであるため、分割してみると、ABCEというセグメント分割になり、この場合、新しいセグメントEとファイル情報だけがストレージに格納されます。



また、2回目以降のバックアップでは格納されたセグメント情報を参照にしながら、新規のセグメントだけが格納されていきます。




Copyright (C) 2014 バックアップにおける重複排除 All Rights Reserved.