高可用性 (HA) システムの管理

高可用性 (HA) システムは、同一に構成されてクラスターとして指定された複数のマシン (1 次と 1 つ以上のバックアップ・マシン) で構成されます。各マシンは、クラスター内のノードと見なされます。1 次およびバックアップ・ノードは、クラスター名と IP アドレスを共用します。外部プロセスはこの名前と IP アドレスを使用して、クラスター上のサービスにアクセスします。サービスは 1 次またはいずれかのバックアップ・ノードで実行します。ノードはすべて、共用新磁気ディスク制御機構 (RAID) ストレージ・システムにアクセスできます。Windows システムの場合のみ、共用 RAID ストレージ・システムはアクティブ・ノードでのみ使用されます。

HA 構成には、応答しない (失敗した) ソフトウェア・プログラムのシャットダウンおよび自動再始動と、アクティブ・ノードで障害が検出されたときにクラスター・バックアップ・ノードにマイグレーションする機能が用意されています。クラスター・バックアップ・ノードは、1 次ノードで障害が訂正されてフェイルバックが開始される (つまり、手動で処理を元のシステムに戻す) 時点まで、クラスター名と IP アドレスを想定して、システム処理を自動的に引き受けます。

ここでは、IBM WebSphere InterChange Server を含む高可用性システムの管理方法についての、以下の内容を説明します。

サポートされる HA 環境

"Windows HA システムの保守"

サポートされる HA 環境

高可用性 (HA) オプションは、以下のオペレーティング・システムで使用できます。

http://www.ibm.com/software/integration/supportpace/
category.html#cat2

さらに、「システム・インストール・ガイド (UNIX 版)」および「システム・インストール・ガイド (Windows 版)」の両方に、HA 環境で使用するハードウェアおよびソフトウェアの構成方法についての基本的な説明が記載されています。

Windows HA システムの保守

システム・インストール・ガイド (Windows 版)」に記述された構成手順に従って HA システムをセットアップしたら、最小の保守または再構成が必要です。ここでは、Microsoft Cluster Server (MSCS) ソフトウェアを使用するために Windows オペレーティング・システムにセットアップされる HA システムを保守するいくつかのタスクを要約します。次のトピックを取り上げます。

クラスター状況の検査

MSCS Cluster Administrator はクラスターの状況の管理および検査に使用する主要管理ツールです。IBM WebSphere InterChange Server などの各リソースが、その状態 (オンラインかオフライン、失敗、またはオンラインかオフライン保留中)、所有者 (ノード 1 またはノード 2)、およびリソースのタイプ (IBM WebSphere InterChange Server、ディスク・リソース、またはコネクターなどの記述) とともにリストされます。このウィンドウから、個々のサービスの状況とアクティブ状態のクラスター・ノードを確認できます。

その他の Windows 管理ツールで、クラスターの状況についての情報が提示されます。特に、クラスターをモニターする次のツールの使用法の詳細については、MSCS オンライン・ヘルプおよびドキュメンテーションを確認してください。
Windows イベント・ビューアー システム、セキュリティー、およびアプリケーション・イベントの各ログの表示および管理
「コントロール パネル」の「Windows Services」オプション クラスター・サービスの実行を検証

フェイルオーバーの検出

MSCS Administrator には、グループ、リソースなどの要素のさまざまなリストの他にいくつかのタイプのアイコンが表示されます。最も重要なアイコンはノードダウン・アイコンです。これは障害がクラスター・ノードで発生し、そのグループおよびリソースが無事であるクラスター・ノードに転送されたことを示します。ノードダウン・アイコンは、MSCS Administrator に赤の X 印が付いたクラスター・ノード・アイコンとして表示されます。

ノードダウン・アイコンは必ずしも、グループまたはリソースのすべてで機能が失われたことを意味しません。通常の操作では、グループはバックアップ・クラスター・ノードにフェイルオーバーされます。

グループを移動した保守の実行

ノードのクラスター・サービスを停止すると、クライアントがそのノードを使用してクラスター・リソースにアクセスできなくなり、すべてのグループが他のノードに移動されます (フェイルオーバー・ポリシーで可能な場合)。これは、1 次ノードをオフラインにして、保守を実行したりそのソフトウェアをアップグレードしたりする必要がある場合に便利です。以下の手順で、1 次ノードを保守またはアップグレードするためにバックアップ・ノードへの移動を実行する方法を説明します。

  1. ノード・アイコンをクリックして、「ファイル」メニューをクリックし、「クラスター・サービスの停止 (Stop Cluster Service)」を選択して、バックアップ・ノードのクラスター・サービスを停止します。
  2. 実行される保守がソフトウェア・アップグレードの場合は、バックアップ・ノードをアップグレードします。実行可能ファイルおよびライブラリーはノードのディスク、データ・ファイルは共用 RAID に必ず配置してください。
  3. 「ファイル」> 「クラスター・サービスの開始 (Start Cluster Service)」をクリックして、バックアップ・ノードでクラスター・サービスを再始動します。
  4. 1 次ノードで、各グループを右マウス・ボタン・クリックして「グループの移動 (Move Group)」を選択します。

    これにより、リソースの可用性を失わないで、サーバーをオフラインにできます。

  5. ノード・アイコンをクリックし、「ファイル」>「クラスター・サービスの停止 (Stop Cluster Service)」をクリックして、1 次ノードのクラスター・サービスを停止します。
  6. バックアップ・ノードをアップグレードしたのと同じ方法で、1 次ノードをアップグレードします。
  7. 「ファイル」>「クラスター・サービスの開始 (Start Cluster Service)」をクリックして、1 次ノードでクラスター・サービスを再始動します。
  8. バックアップ・ノードで、各グループを右マウス・ボタン・クリックし、「グループの移動 (Move Group)」を選択してグループを 1 次ノードに戻します。

リソースの状況の変更

手動で個々のリソースをオンラインにしたりオフラインにしたりするには、Cluster Administrator を使用します。リソースを選択し、「ファイル」メニューから「オンラインにする (Bring Online)」、「オフラインにする (Take Offline)」、または「障害の開始 (Initiate Failure)」を選択します。WebSphere MQ、コネクター、および IBM WebSphere InterChange Server のみをオンラインまたはオフラインします。

Copyright IBM Corp. 1997, 2004