メディア・エラーと不良ブロックについて

ブロックを正常に読み取ることができない場合、ストレージ・システムはメディア・エラー応答をホストに返します。ホスト読み取りに対する Storwize® V3700 の応答は、この動作の後に続きます。

提供されるボリュームの仮想化では、メディア・エラーがホストに返される時間が延びます。 この非仮想化システムとの違いにより、Storwize V3700・システムではメディア・エラーではなく不良ブロック という用語を使用します。

システムは、管理対象ディスク (MDisks) 上のエクステントからボリュームを割り振ります。 MDisk は、外部ストレージ・コントローラー上のボリューム、または内蔵ドライブから作成された RAID アレイでも構いません。いずれの場合も、使用される RAID レベルに応じて、単一のドライブでは通常、読み取りエラーからの保護があります。ただし、複数のドライブにエラーがある場合、またはドライブが再ビルド中か、その他の問題が原因でドライブがオフラインである場合、メディア・エラーが発生する可能性があります。

システムは、任意のボリュームを基礎になる一連の物理ストレージから別のストレージに移動したり、あるいは FlashCopy を使用するボリュームを複製するマイグレーション機能を提供します。いずれの場合も、元のボリュームの論理ブロック・アドレスが読み取られると、マイグレーション済みボリュームまたは複製済みボリュームは、ホストにメディア・エラーをホストに返します。 システムは、読み取りできない論理ブロック・アドレスの場所を記録する不良ブロックの表を維持します。 これらの表は、ボリュームにストレージを提供している MDisk に関連しています。

不良ブロックの位置の照会には、dumpmdiskbadblocks コマンドまたは dumpallmdiskbadblocks コマンドを使用できます。
重要: dumpmdiskbadblocks コマンドは、作成された仮想メディア・エラーのみを出力し、MDisk あるいはドライブ上の実際のメディア・エラーのリストは出力しません。

不良ブロックの位置の記録に使用される表がいっぱいになる場合があります。 表は、一般的に MDisk またはシステム上のいずれかでいっぱいになることがあります。 表がいっぱいになると、ソース・ボリュームの正確なイメージを作成できないため、不良ブロックを作成していたマイグレーションまたはレプリカ生成は失敗します。

システムは以下の状態の場合に、イベント・ログにアラートを作成します。
  • メディア・エラーか検出され、不良ブロックが作成される場合
  • 不良ブロックの表がいっぱいになった場合

表 1 に、不良ブロックのエラー・コードをリストします。

表 1. 不良ブロックのエラー
エラー・コード 説明
1840 管理対象ディスクに不良ブロックがあります。 外部コントローラーの場合は、これはコピーされたメディアのエラーのみである可能性があります。
1226 MDisk に許可される最大数の不良ブロックがすでに存在するため、システムは不良ブロックを作成できませんでした。
1225 システムに許可される最大数の不良ブロックがすでに存在するため、システムは不良ブロックを作成できませんでした。

これらのアラートに対する推奨アクションでは、この状態の修復をガイドしています。

当該ブロックに対してボリュームの削除、または書き込み入出力を実行して、ボリューム・ディスク・エクステントを割り振り解除することで、不良ブロックをクリアしてください。 不良ブロックが検出された場合はすぐに修復することをお勧めします。このアクションにより、ボリュームが複製されるか、マイグレーションされるときに、不良ブロックの伝搬が防止されます。しかし、不良ブロックがアプリケーションによって使用されていないボリュームの一部に存在することがあります。例えば、初期化されていないデータベースの一部に存在している場合があります。これらの不良ブロックは、アプリケーションによりデータがこれらの領域にかきこまれるときに修復されます。修復が行われるまでは、不良ブロック・レコードは使用可能な不良ブロック・スペースを使い果たし続けます。