ハードウェア・エラーの修正

システム・リカバリー手順を実行する前に、ハードウェアの問題の根本原因を特定して修正することが重要です。

システム障害の原因になるような障害がある場合、根本原因を特定して修正すると、システムのリカバリーに役立ちます。 以下は、容易に解決できる一般的な問題です。
  • ノードの電源がオフになっているか、電源コードのプラグが抜かれています。
  • このシステムの一部であるすべてのノード・キャニスターのノード状況を調べます。 ノード・エラー 578 またはノード・エラー 550 をのぞき、すべてのハードウェア・エラーを解決します。
    • すべてのノードがノード・エラー 578 またはノード・エラー 550 を報告しているはずです。これらのエラー・コードは、システムが構成データを失ったことを示しています。いずれかのノードがこれらのエラー・コード以外のものを報告している場合、リカバリーを実行しないでください。構成ノード以外のノードが他のノード・エラー (550 ノード・エラーなど) を報告する状況が発生する場合があります。550 エラーも、ノードがシステムに結合できないことを示しています。
    • いずれかのノードがノード・エラー 550 を示す場合、サービス・アシスタントから 550 エラーに関連するエラー・データを記録します。
      • ノード・エラー 550 のほか、報告には、スペースで区切られたデータが以下のいずれかの形式で示されることがあります。
        • 次の形式のノード ID: <enclosure_serial>-<canister slot ID>(7 文字、ハイフン、1 文字の番号) (例えば、01234A6-2)
        • 次の形式のクォーラム・ドライブ ID: <enclosure_serial>:<drive slot ID>[<drive 11S serial number>] (7 文字、コロン、1 文字または 2 文字の番号、左大括弧、22 文字、右大括弧) (例えば、01234A9:21[11S1234567890123456789])
        • 次の形式のクォーラム MDisk ID: WWPN/LUN (16 桁の 16 進数字、スラッシュ、10 進数) (例えば、1234567890123456/12)
      • エラー・データにノード ID が示されている場合、その ID によって参照されるノードがノード・エラー 578 を示していることを確認します。ノードがノード・エラー 550 を示している場合、2 つのノードが相互に通信できることを確認します。SAN 接続を検査し、550 エラーが引き続き存在している場合は、サービス・アシスタントから「ノードの再起動」をクリックして 2 つのノードのいずれかを再起動します。
      • エラー・データにクォーラム・ドライブ ID が示されている場合、報告されたシリアル番号を持つエンクロージャーを見つけます。エンクロージャーの電源がオンになっていること、および報告されたスロットのドライブが電源オン状態になっていて機能していることも確認します。障害を報告しているノード・キャニスターが、リストされているエンクロージャーの入出力グループ内に存在している場合は、そのノード・キャニスターにリスト内のエンクロージャーへの SAS 接続があることを確認します。障害を報告しているノード・キャニスターが、リストされているエンクロージャーとは異なる入出力グループ内に存在している場合は、リストされているエンクロージャーに、その入出力グループのコントロール・エンクロージャーにある両方のノード・キャニスターへの SAS 接続があることを確認します。検査後、サービス・アシスタントから「ノードの再起動」をクリックしてノードを再起動します。
      • エラー・データにクォーラム MDisk ID が示されている場合、このノードとその WWPN の間の SAN 接続を検査します。ストレージ・コントローラーを調べて、参照されている LUN がオンラインであることを確認します。 検査後に、550 エラーが引き続き存在している場合は、サービス・アシスタントから「ノードの再起動」をクリックして、ノードを再起動します。
      • エラー・データが存在していない場合、ファイバー・チャネル・ネットワーク経由の接続数がノード間で不足していることが、エラーの原因です。各ノードでは、同一のエンクロージャーにはないすべてのノードに対して、少なくとも 2 つの独立したファイバー・チャネル論理接続またはログインが必要です。独立した接続とは、両方の物理ポートが異なっている接続を指します。この場合、ノード間に接続は存在しますが、冗長の接続は存在しません。エラー・データが存在していない場合、SAN が初期化するまで 3 分待ってください。次に、以下を検査します。
        • すべてのノードで、少なくとも 2 つの接続された作動可能なファイバー・チャネル・ポートが存在している。
        • SAN ゾーニングで、各ポートが、他のすべてのノードにあるすべてのポートに接続することが許可されている。
        • 冗長 SAN (使用されている場合) がすべて作動可能である。

        検査後に、550 エラーが引き続き存在している場合は、サービス・アシスタントから「ノードの再起動」をクリックして、ノードを再起動します。

      注: 上記のシナリオをすべて解決した後で、半分以上のノードがノード・エラー 578 を報告する場合、リカバリー手順を実行するのが適切です。さらに支援が必要な場合は、IBM® サポートに連絡してください。
    • ノード・エラー 550 を報告するすべてのノードで、これらのエラーで識別されている欠落ハードウェアのすべてが電源オン状態で接続されており、障害が発生していないことを確認します。
    • システムを再起動できず、現行のノード以外のノードがノード・エラー 550 またはノード・エラー 578 を報告している場合は、それらのノードからシステム・データを除去する必要があります。このアクションにより、データ損失が確認され、ノードは必要な候補の状況になります。