分散アレイの属性

SAN ボリューム・コントローラー 2145-SV1 および これらのアレイは 4 個から 128 個のドライブを格納でき、ドライブが障害を起こした後に冗長性を維持するために使用される再作成領域を格納することもできます。 その結果、分散構成は再作成時間を大幅に短縮し、ボリュームが冗長性リカバリーの余分な負荷にさらされる機会を少なくします。

分散 RAID アレイでは、再作成領域がアレイ内のすべてのドライブに分散されるので、そのような問題が解決されます。再作成書き込みワークロードは、単一のスペア・ドライブよりもむしろ、すべてのドライブにわたって分散され、アレイでの再作成にかかる時間が短縮されます。 分散アレイ構成には 4 個から 128 個のドライブを含めることができます。分散アレイでは、障害が発生するまで分離ドライブがアイドルでいる必要性がなくなります。1 つ以上のドライブをスペアとして割り振る代わりに、すべてのメンバー・ドライブの特定の再作成エリアにスペア容量が分散されます。 データをより高速に再作成領域にコピーすることができ、冗長性がはるかに短時間で復元されます。また、再作成の進行中、使用可能なすべてのドライブがあらゆるボリューム・エクステントに使用されるため、プールのパフォーマンスがより一様なものとなります。障害ドライブが取り替えられると、分散されたスペア容量からドライブにデータがコピーされて戻されます。「ホット・スペア」ドライブとは異なり、読み取り/書き込み要求は、再作成領域として使用されていない、ドライブの他の部分で処理されます。再作成領域の数は、アレイの幅に基づきます。再作成領域のサイズにより、劣化状態になる危険を冒さずに障害ドライブを分散アレイで何回リカバリーできるかが決まります。例えば、RAID 6 ドライブを使用する分散アレイでは、同時に 2 件の障害に対処できます。障害が起きたドライブが再作成された後、アレイは別の 2 件のドライブ障害に耐えることができます。すべての再作成領域がデータのリカバリーに使用された場合、次にドライブ障害が発生すると、アレイの機能は低下します。

サポートされる RAID レベル

このシステムは、分散アレイでは以下の RAID レベルをサポートします。

分散 RAID 5
分散 RAID 5 アレイは、各ストライプ上の 1 個のパリティー・ストリップを使用して、 メンバー・ドライブにデータをストライピングします。これらの分散アレイは、4 個から 128 個のドライブをサポートすることができます。 RAID 5 分散アレイは、1 つのメンバー・ドライブの障害に耐えることができます。
分散 RAID 6
分散 RAID 6 アレイは、各ストライプ上の 2 個のパリティー・ストリップを使用してメンバー・ドライブにデータをストライピングします。 これらの分散アレイは、6 個から 128 個のドライブをサポートすることができます。RAID 6 分散アレイは、2 つのメンバー・ドライブで同時に障害が発生しても許容できます。

分散アレイの例

図 1 に、RAID レベル 6 で構成された分散アレイの例を示します。アレイ内のすべてのドライブがアクティブです。再作成領域はすべてのドライブ間に分散され、ドライブ数にはすべてのドライブが含まれます。
  •  1  アクティブ・ドライブ
  •  2  すべてのドライブ間に分散された再作成領域
  •  3  すべてのドライブを含むドライブ数
  •  4  データのストライプ (2 つのストライプが示されています)
  •  5  ストライプ幅
  •  6  パック (ドライブ数にストライプ幅を乗算した値)
  •  7  アレイ内の追加のパック (示されていません)
図 1. 分散アレイ (RAID 6 レベル)
この図は、RAID 6 レベル構成の分散アレイの例を示しています。
図 2 は、障害ドライブを含む分散アレイを示しています。データをリカバリーするために、データは複数のドライブから読み取られます。リカバリーされたデータは、アレイ内のすべてのドライブ間に分散された再作成領域に書き込まれます。残りの再作成領域はすべてのドライブ間に分散されます。
  •  1  障害ドライブ
  •  2  すべてのドライブ間に分散された再作成領域
  •  3  残りの各ドライブを循環する残りの再作成領域
  •  4  アレイ内の追加のパック (示されていません)
図 2. 障害ドライブのある分散アレイ (RAID 6 レベル)
この図は、障害ドライブがある RAID 6 レベル構成の分散アレイの例を示しています。

アレイ幅

アレイ幅ドライブ数 と呼ばれることもあり、分散アレイ内のドライブの合計数を示します。この合計には、データ容量とパリティーに使用されるドライブの数と、データのリカバリーに使用される再作成領域 が含まれます。

再作成領域

再作成領域 とは、ドライブ障害の後にデータを再生成するために、分散アレイ内に予約されているディスク容量のことです。非分散アレイとは異なり、再作成領域はアレイ内のすべてのドライブ間に分散されます。データはコピーバック・プロセス中に再作成されるので、再作成領域は分散アレイのパフォーマンスに貢献します。すべてのボリュームが入出力要求を実行するからです。

ストライプおよびストライプ幅

ストライプ冗長性単位 と呼ばれることもあり、アドレス指定できるデータの最小量です。分散アレイの場合、ストライプ・サイズは 128 または 256 KiB とすることができます。

ストライプ幅 は、ドライブ障害の後にデータが再生成されるとき、一度に書き込むことができるデータのストライプの数を示します。この値は、冗長性単位幅 と呼ばれることもあります。図 1 では、アレイのストライプ幅は 5 です。

ドライブ・クラス

分散アレイのパフォーマンスを強化するためには、すべてのドライブが同じ、または上位のドライブ・クラスに属している必要があります。各ドライブ・クラスは、その drive_class_id で識別されます。システムは、以下の情報を使用して各ドライブのドライブ・クラスを判別します。
  • ブロック・サイズ (512 または 4096)
  • 容量
  • 入出力グループ
  • RPM 速度 (7.2 K、10 K、または 15 K。SSD の場合はブランク)
  • テクノロジー (不明、SAS_HDD、SAS_Nearline、または SDD)

分散アレイ内の障害メンバー・ドライブを交換するために、システムは、障害ドライブと同じドライブ・クラスの別のドライブを使用できます。システムは、上位ドライブ・クラスからドライブを選択することもできます。例えば、2 つのドライブ・クラスに、テクノロジー・タイプは同じでも、データ容量が異なるドライブが含まれていることがあります。その場合、上位ドライブ・クラスは、大きな容量のドライブが入っている方のドライブ・クラスです。

システム上で使用できるすべてのドライブ・クラスに関する情報を表示するには、lsdriveclass コマンドを使用します。lsdriveclass コマンドの出力例には、システム上の 4 つのドライブ・クラスを示しています。 ドライブ・クラス 209 には 278.9 GB の容量を持つドライブが入っていて、ドライブ・クラス 337 には 558.4 GB の容量を持つドライブが入っています。ドライブの RPM 速度、テクノロジー・タイプ、およびブロック・サイズは同じですが、ドライブ・クラス 337 はドライブ・クラス 209 の上位と見なされます。

lsdriveclass コマンドの出力例

id  RPM   capacity IO_group_id IO_group_name tech_type block_size candidate_count superior_count total_count
1   10000 418.7GB  0           io_grp0       sas_hdd   512        0               0              2
129 10000 278.9GB  0           io_grp0       sas_hdd   512        0               0              5
209 15000 278.9GB  2           io_grp2       sas_hdd   4096       2               5              2
337 15000 558.4GB  3           io_grp3       sas_hdd   4096       3               3              3

低速書き込み優先順位の設定

冗長アレイが読み取り/書き込み入出力操作を実行している場合、アレイのパフォーマンスは最も低速のメンバー・ドライブによって束縛されます。ドライブが内部 ERP プロセスを実行する場合、SAS ネットワークが不安定であるか、アレイに割り当てられている作業が多すぎると、メンバー・ドライブのパフォーマンスが通常より大幅に低下することがあります。このような状況では、冗長度を提供するアレイが短い割り込みを受け入れて、低速コンポーネントへの書き込みや低速コンポーネントからの読み取りを回避することができます。パフォーマンスの悪いドライブにマップされている書き込みは、他のコピーまたはパリティーにコミットされ、その後、良好な状況で (他の障害がない場合) 完了します。メンバー・ドライブがリカバリーすると、メンバーが低速だった間に非同期としてマークされたストリップを書きこむバックグラウンド・プロセスによって、冗長性が復元されます。

この技法は分散アレイの slow_write_priority 属性を設定することによって制御され、この属性は、アレイの作成時にデフォルトで latency に設定されます。 latency に設定されていると、アレイは低いメンバー・パフォーマンスの平滑化を試みるために非同期になることを許されます。charray コマンドを使用して、slow_write_priority 属性を redundancy に変更することができます。redundancy に設定された場合、アレイは非同期になることを許されません。ただし、アレイは、冗長なパスから低速のコンポーネントに読み取りを返すことによって、読み取りパフォーマンスの低下を回避することができます。

アレイが latency モードを使用するか、redundancy モードでコンポーネントの読み取りを回避しようとする場合、システムはドライブを定期的に評価して、ドライブが再びシステムの信頼できる部分になったかどうかを判断します。ドライブが良好なパフォーマンスを示さない場合、またはアレイ内でパフォーマンス障害を起こす頻度が多すぎる場合、システムはパフォーマンスの低いドライブの露出が続かないように、そのハードウェアを停止させます。システムがハードウェアを停止させるのは、ドライブのパフォーマンスが低下した別の説明を見つけられない場合のみです。

分散ドライブの交換

ドライブ上の障害 LED が点灯する場合、ドライブには障害のマークが付けられ、そのドライブは分散アレイで使用されなくなります。システムは、障害ドライブが交換されたことを検出すると、障害ハードウェアをアレイ構成から自動的に削除します。新規ドライブが適切である (例えば、同じドライブ・クラスに属している) 場合、システムは、コピーバック操作を開始して、分散アレイで再作成領域を使用できるようにします。