HA 環境のトラブルシューティングのヒント

HA 環境で問題が発生した場合は、以下のトピックを参照してください。

[AIX Solaris HP-UX Linux Windows][z/OS]

メッセージ HMGR0218I が Java 仮想マシンが始動した後に表示されない

適切にセットアップ された HA 環境では、HA マネージャーが管理中の環境を再評価 して、環境に追加された新規コンポーネントを受け入れることができます。 例えば、インフラストラクチャーに Java™ 仮想マシン (JVM) が追加されると、ディスカバリー・プロセスが開始されます。開始中に、JVM はそのコア・グループの他のメンバーとの接触を試行します。 他の実行中の JVM を検出すると、その JVM との結合プロセスを開始します。 このプロセスは、その JVM がコア・グループに参加できるかどうかを判別します。 新規 JVM がコア・グループのメンバーとして受け入れられた場合は、その新規 JVM を含むすべての JVM が、メッセージ HMGR0218I に記録されます。 このメッセージは、管理コンソールにも表示されます。

メッセージ HMGR0218I は、現在オンライン状態になっているコア・グループ内のアプリケーション・サーバーの数を示します。 JVM の開始後にこのメッセージが表示されない場合は、構成または通信に問題が発生しています。この状態を修正するには、 デプロイメント・マネージャーを使用してノード・エージェントに同期を指示するか、 あるいは syncNode コマンドを使用して手動で同期して、 アプリケーション・サーバーが最新の構成で実行されていることを確認します。 それでも JVM がコア・グループに参加できない場合は、ネットワーク構成に問題があります。

[IBM i]

メッセージ HMGR0218I がサーバーが始動した後に表示されない

適切にセットアップ された HA 環境では、HA マネージャーが管理中の環境を再評価 して、環境に追加された新規コンポーネントを受け入れることができます。 例えば、インフラストラクチャーに Java 仮想マシン (サーバー) が追加されると、ディスカバリー・プロセスが開始されます。 開始中に、サーバーはそのコア・グループの他のメンバーと接触しようとします。 他の実行中のサーバーを検出すると、そのサーバーとの結合プロセスを開始します。 このプロセスは、そのサーバーがコア・グループに参加できるかどうかを判別します。 新規サーバーがコア・グループのメンバーとして受け入れられた場合は、その新規サーバーを含むすべてのサーバーが、メッセージ HMGR0218I を記録します。 このメッセージは、管理コンソールにも表示されます。

メッセージ HMGR0218I は、現在オンライン状態になっているコア・グループ内のアプリケーション・サーバーの数を示します。 サーバーの開始後にこのメッセージが表示されない場合は、構成または通信に問題が発生しています。この状態を修正するには、 デプロイメント・マネージャーを使用してノード・エージェントに同期化を指示するか、 あるいは syncNode コマンドを使用して手動で同期化を行って、 現在の構成でアプリケーション・サーバーが実行されているかどうかを検査します。 それでもサーバーがコア・グループに参加できない場合は、ネットワーク構成に問題があります。

システム・ログ・ファイルにメッセージ HMGR0123I が表示される

コア・グループ・メンバーの状況が、アクティブ・コーディネーターの変更と同時に変更されると、 メッセージ HMGR0123I がシステム・ログ・ファイルに表示されることがあります。例えば、 コア・グループ・メンバーが再始動してアクティブ・コーディネーターになる場合に、 このメッセージが発行されることがあります。

この通知メッセージは、通常は深刻な問題を 示すものではありません。このメッセージがシステム・ログ・ファイルに表示されたとしても、 新しいアクティブ・コーディネーターは更新されたグループ状況を受信します。このメッセージが なるべく出ないようにするには、再始動の回数が少ないコア・グループ・メンバーを、 優先コア・グループ・コーディネーターとして選択します。

システム・ログ・ファイルの CPU 欠乏メッセージ

HA マネージャー・スレッドが一貫性のあるランタイムを得ることができるのに十分な物理メモリーがない場合は常に、 「CPU starvation detected」というエラー・メッセージがシステム・ログ・ファイルに 表示されます。CPU が、受け取った作業を処理しながらスワップアウト・プロセスのロードに大半の時間を費やしている場合に、thread starvation が起こることがあります。HA マネージャーはこの状態を検出して、これらのエラー・メッセージを記録し、スレッドが要求されたランタイムを取得していないことをユーザーに通知します。

高いパフォーマンスを実現し、これらのエラー・メッセージを受け取らないようにするには、単一のマシンで実行されている各 Java 処理に対して、少なくとも 512 MB の RAM を割り当てることをお勧めします。

セキュリティーが有効な場合の大規模なセル構成における高い CPU 使用量

特定の構成および状態では、ディスカバリーにかかる時間が長くなります。
  • コア・グループ内で多数のプロセスが定義されている場合、これらのプロセスをサポートするには、それに比例して多数の接続を確立する必要があります。
  • コア・グループ内で多数の非アクティブなプロセスが定義されている場合、各ディスカバリー間隔で、それに比例して多数の接続が試行されます。
  • 管理セキュリティーが使用可能になっている場合、DCS 接続は保護されており、 接続をオープンする際のインパクトは大幅に増加します。

管理コンソールの「ディスカバリーと障害の検出 (Discovery and failure detection)」ページを使用して、ディスカバリー・プロトコルが、未接続のコア・グループ・メンバーのセットを計算し、それらのメンバーへの接続のオープンを試行するまでに待機する時間を増やします。 連続するディスカバリーの間隔を大きくすると、ディスカバリーで消費される CPU 時間が減少します。詳しくは、『コア・グループに対するディスカバリー・プロトコルの構成』トピックを参照してください。

過大負荷による一時的な高可用性ハートビート障害

ワークロードが大きい場合、高可用性構成の複製パートナー間で、両方のパートナーが正常に実行されているようでも、一時的ハートビート障害の状態が発生する場合があります。

[Linux]Linux オペレーティング・システムの場合、この問題の原因は、複製パートナー間の複製チャネルの TCP 接続問題である可能性があります。これらの接続問題が発生するのは、交換されている大量の複製データをサポートできるほど TCP バッファーが十分に大きくないためです。このような誤ったハートビート障害の状態を回避するには、TCP バッファー・サイズを、Linux 向け SIP サーブレットの調整方法を説明するトピック内の、Linux カーネル調整のセクションで推奨されるサイズに調整します。


トピックのタイプを示すアイコン 参照トピック



タイム・スタンプ・アイコン 最終更新: last_date
http://www14.software.ibm.com/webapp/wsbroker/redirect?version=cord&product=was-nd-mp&topic=rtrb_ha_env_trbl
ファイル名:rtrb_ha_env_trbl.html