[AIX Solaris HP-UX Linux Windows][z/OS]

ヘルス管理

ヘルス・モニターおよびヘルス管理サブシステムにより、ポリシー主導型アプローチをとって、アプリケーション・サーバー環境をモニターし、一定の基準が検出されたときにアクションを実行できます。

ヘルス・モニターおよび管理サブシステム

ヘルス管理サブシステムは、ご使用環境におけるサーバーの状態とサーバーが実行する処理を連続的にモニターできます。ヘルス管理サブシステムは、ヘルス・コントローラーヘルス・ポリシー の 2 つの主要素で構成されています。

ヘルス・コントローラーは、ヘルス・モニターおよび 管理サブシステムを制御し、ある一定の条件を確保するためにヘルス・ポリシーに従って動作する オートノミック・マネージャーです。ヘルス・コントローラーは、 HA マネージャーによって管理される分散リソースであり、ノード・エージェントおよびデプロイメント・マネージャーのすべてのプロセス 内に存在します。ヘルス・コントローラーは、これらのプロセスの 1 つでアクティブになっています。 アクティブ・プロセスが失敗した場合、ヘルス・コントローラーは別のノード・エージェントまたは デプロイメント・マネージャーのプロセスでアクティブになることができます。

ヘルス・コントローラーは、制御サイクルに基づいて実行されます。制御サイクルの長さは、 ヘルス・コントローラーによって開始される環境チェックの間隔を定義します。制御サイクルの終わりに、 ヘルス・コントローラーは環境をチェックし、ヘルス条件の違反を解決するためのランタイム・タスク を生成します。

ユーザーの環境でモニターされるヘルス条件およびその条件が満たされない場合に実行されるヘルス・アクション を含むヘルス・ポリシーを定義します。

ヘルス・コントローラーを使用してヘルス管理の使用可否を設定しながら、 複数のヘルス・ポリシーをシステムに定義しておくことができます。 サーバー再始動の頻度を制限したり、一定期間中の再始動を禁止したりできます。

ヘルス管理サブシステムは、Intelligent Management の操作モードが自動または監視であるときに機能します。 ポリシーのリアクション・モードが自動に設定されている場合、 ヘルス管理システムはヘルス・ポリシー違反が検出されるとアクションを 起こします。監視モードでは、ヘルス管理システムは 1 つ以上の リアクションを提示するランタイム・タスクを作成します。 システム管理者は、 提案されたアクションを承認または否認できます。

ヘルス条件

ヘルス条件は、ご使用環境内でモニターする変数を定義します。 ヘルス・ポリシー条件には、いくつかのカテゴリーがあります。 事前定義の以下のヘルス条件から選択できます。
期間ベースの条件
サーバーが稼働中の時間を追跡します。この時間が定義済みのしきい値を超えると、 ヘルス・アクションが実行されます。
要求タイムアウト超過条件
タイムアウトにできる HTTP 要求のパーセンテージを指定します。要求のパーセンテージが 定義済みの値を超えると、ヘルス・アクションが実行されます。タイムアウト値は、環境構成によって異なります。 要求タイムアウト超過ヘルス条件について詳しくは、『要求タイムアウト超過ヘルス・ポリシーのターゲット・タイムアウト値』を参照してください。
応答時間超過条件
要求の完了に要する時間を追跡します。この時間が定義済みの応答時間しきい値を超えると、ヘルス・アクションが実行されます。
重要: タイムアウトしきい値セットを超える要求は、応答時間超過の計算には含まれません。例えば、デフォルトのタイムアウト値 60 秒が有効な場合、このしきい値を超えてタイムアウトになる要求は応答時間超過の計算に含まれません。この制約は、環境に要求タイムアウト超過ヘルス条件が定義されていない場合にも適用されます。
メモリー条件: 超過メモリー使用率
メンバーのメモリー使用量を追跡します。メモリー使用率が指定時間のヒープ・サイズのパーセンテージを超過した場合、この状況を修正するためにヘルス・アクションが実行されます。
メモリー条件: メモリー・リーク
Java™ ヒープでサーバーが使用できる空きメモリーの一貫した減少傾向を追跡します。Java ヒープが構成された最大サイズに達したら、ヒープ・ダンプか、サーバー再始動のいずれかを実行できます。
ストーム・ドレーンの状態
応答時間の著しい減少の要因となっている要求を追跡します。 このポリシーは、指定された時系列データにおける変更ポイント検出によって異なります。
ワークロード条件
ポリシー・メンバーが再始動するまでに処理される要求の数を指定します。ポリシー・メンバーが再始動すると、メモリーおよびキャッシュのデータが消去されます。
ガーベッジ・コレクション・パーセンテージ条件
1 つまたは一連の Java 仮想マシン (JVM) をモニターして、指定された期間内で JVM がガーベッジ・コレクションに使用する時間が、定義されたパーセンテージを超えていないかどうかを判定します。
これらの条件について詳しくは、 管理コンソールの「ヘルス・ポリシー汎用プロパティーの定義」パネルで ヘルプ・アイコンをクリックしてください。

これらの事前定義ヘルス・ポリシー条件を通して、 ご使用の環境における必要データの分布の最適化、モニターの影響の最小化、およびヘルス・ポリシーの実施 を行うためのアクションが実行されます。

これらの事前定義ヘルス条件が要件に合わない場合は、 ヘルス・ポリシーにカスタム条件を定義することもできます。カスタム条件は副次式として定義し、ご使用の環境のメトリックに対してテストします。カスタム条件を定義する場合は、データの収集、データの分析、および必要に応じたヘルス・ポリシーの実施にかかるコストを考慮してください。ネットワーク内のトラフィック量およびサーバー数によっては、このコストが増加する場合があります。カスタム・ヘルス条件 を実動で使用する際は、前もって条件のパフォーマンスを分析してください。
例:
PMIMetric_FromServerStart$systemModule$cpuUtilization  >  90L

ヘルス・アクション

ヘルス・アクションは、ヘルス条件が満たされていない場合に使用する プロセスを定義します。定義する条件に応じて、アクションは異なります。以下の表には、さまざまなサーバー環境でサポートされるヘルス・アクションがリストされています。

表 1. さまざまなサーバー・タイプに対する事前定義ヘルス・アクションのサポート
ヘルス・アクション 同じ Intelligent Management セルで稼働する WebSphere® アプリケーション・サーバー 他のミドルウェア・サーバー (外部 WebSphere アプリケーション・サーバーを含む)
サーバーの再始動 サポートされる サポートされる
スレッド・ダンプの取得 サポートあり 非サポート
Java 仮想マシン (JVM) のヒープ・ダンプの取得 IBM® Software Development Kit で稼働しているサーバーに対してサポート 非サポート
サーバーの保守モードの設定 サポートされる サポートされる
サーバーの保守モードの設定、およびサーバーへの HTTP および SIP 要求アフィニティーの中断 サポートされる サポートされる
サーバーの保守モードの設定解除 サポートされる サポートされる
Simple Network Management Protocol (SNMP) トラップの生成 サポートされる サポートされる
注: 動的クラスターでは、次のいくつかの形式の 1 つを使用して再始動させることができます。
  • 同じ場所で再始動します (サーバーの停止、サーバーの始動)。動的クラスターが手動モードの 場合、常にこの再始動が起こります。
  • 別のノードでサーバー・インスタンスを開始し、 障害のあるものを停止します。
  • 障害のあるサーバーのみを停止します。ただし、残りのアプリケーション・ インスタンスがデマンドを満たすことが前提です。

また、カスタム・アクションの定義も行えます。カスタム・アクションを使用して、ヘルス条件に違反した場合に実行する実行可能ファイルを定義します。カスタム・アクションを含むヘルス・ポリシーを作成する前に、カスタム・アクションを定義する必要があります。

ヘルス・ポリシーのターゲット

ヘルス・ポリシーのターゲットは、単一のサーバー、クラスターまたは動的クラスター内の各サーバー、オンデマンド・ルーター (ODR)、またはセル内の各サーバーとすることができます。同じサーバー・セットをモニターする複数のヘルス・ポリシーを定義することができます。

事前定義ヘルス条件を使用している場合、サポートは サーバー・タイプによって異なります。一部のミドルウェア・サーバーは、すべてのポリシー・タイプを サポートするわけではありません。以下のテーブルに、サーバー・タイプごとのヘルス・ポリシーのサポートが要約されています。
表 2. 異なるサーバー・タイプのヘルス・ポリシー・サポート
事前定義ヘルス・ポリシー 同じ Intelligent Management セルで稼働する WebSphere アプリケーション・サーバー 他のミドルウェア・サーバー (外部 WebSphere アプリケーション・サーバーを含む)
期間ベース・ポリシー サポートされる サポートされる
ワークロード・ポリシー サポートされる サポートされる
メモリー・リーク検出 サポートされる 非サポート
超過メモリー使用率 サポートされる WebSphere Application Server Community Edition サーバーに対してサポート。他のミドルウェア・サーバー・タイプに対してはサポートなし。
要求タイムアウト超過 サポートされる ODR からの要求の送付先の、その他のミドルウェア・サーバーに対してはサポートあり。
過度の応答時間 サポートされる サポートされる
ストーム・ドレーン検出 サポートされる サポートされる
ガーベッジ・コレクション・パーセンテージ サポートされる 非サポート

デフォルトのヘルス・ポリシー

製品と一緒にインストールされる 事前定義ヘルス条件を使用して、デフォルトのヘルス・ポリシーを作成 できます。

デフォルトのヘルス・ポリシーを作成するには、「動作ポリシー」 > 「ヘルス・ポリシー」 > 「新規」とクリックし、事前定義ヘルス条件のうちの 1 つを 選択します。

デフォルトのヘルス・ポリシーは、監視モードで各サーバーをモニターするため、 正常性の問題を防ぐためにこれらのポリシーを使用することができます。デフォルト・ポリシーに加えて、 より詳細に設定されたポリシーや、特定のサーバーまたはサーバーの集合に対して自動モード操作を 指定するポリシーを定義することができます。以下のリストには、事前定義ヘルス条件を使用して作成できる、 セル全体のデフォルトのヘルス・ポリシーを示します。
  • デフォルトのメモリー・リーク: デフォルトの標準検出レベル。デフォルトのメモリー・リーク・ヘルス・ポリシーは、 パフォーマンス・アドバイザー機能を使用します。このポリシーが使用可能にされると、パフォーマンス・アドバイザーが使用可能になります。 パフォーマンス・アドバイザーを使用不可にするには、このヘルス・ポリシーを除去するか、このヘルス・ポリシーのメンバーシップを限定します。将来の使用 のためにこのヘルス・ポリシーを保持するには、デフォルトのメモリー・リーク・ポリシーは保持し、すべての メンバーを削除してください。メンバーを変更するには、「動作ポリシー」 > 「ヘルス・ポリシー」 > 「Default_Memory_Leak」をクリックします。 ヘルス・ポリシーでメンバーを追加および除去することで、ヘルス・ポリシーのメンバーシップを編集できます。
  • デフォルトの超過メモリー使用率: 15 分の Jvm ヒープ・サイズを 95 パーセントに設定します
  • デフォルトの超過要求タイムアウト (Default excessive request timeout): 要求タイムアウトを 5 パーセントに 設定します
  • デフォルトの超過応答時間: 120 秒に設定します
  • デフォルトのストーム・ドレーン: デフォルトの標準検出レベル
  • ガーベッジ・コレクション・パーセンテージ: 10 パーセントに設定します。デフォルトのサンプリング時間は 2 分です。

デフォルトの ヘルス・ポリシーによって作成される推奨事項を表示し、これらの推奨事項に対するアクションを実行するには、「システム管理」 > 「タスク管理」 > 「ランタイム・タスク」をクリックします。


トピックのタイプを示すアイコン 概念トピック



タイム・スタンプ・アイコン 最終更新: last_date
http://www14.software.ibm.com/webapp/wsbroker/redirect?version=cord&product=was-nd-mp&topic=cwve_odhealth
ファイル名:cwve_odhealth.html