WebSphere Extended Deployment, Version 6.0.x     Betriebssysteme: AIX, HP-UX, Linux, Solaris, Windows, z/OS

Fehlerbehebung bei der Vitalitätsüberwachung

Dieser Artikel beschreibt, wie Sie vorgehen können, wenn die Vitalitätsüberwachung gar nicht oder nicht wie erwartet funktioniert.

Die richtigen Protokolle finden

Der Controller für Vitalitätsüberwachung wird im Rahmen des Node Agent auf Knoten ausgeführt, die keine Deployment-Manager-Knoten sind. Sie können die Funktion "Laufzeittopologie" in der Administrationskonsole verwenden, um die aktive Instanz des Vitalitätscontrollers zu ermitteln. Klicken Sie auf Laufzeitoperationen > Laufzeittopologie und suchen Sie in der Anzeige "Laufzeittopologie" das rote Kreuzsymbol. Falls Knotengruppen konfiguriert sind, wählen Sie diese aus. Wählen Sie im zweiten Menü die nicht zugeordneten Knoten aus. Die Protokollnachrichten der Vitalitätsüberwachung werden in dem Node-Agent-Protokoll auf dem mit dem roten Kreuz gekennzeichneten Knoten aufgezeichnet.

Einstellungen für den Vitalitätscontroller

Die folgende Liste beschreibt Probleme, die aufgrund der Einstellungen des Vitalitätscontrollers auftreten können:
Controller für Vitalitätsüberwachung ist inaktiviert
Überprüfen Sie die Einstellung. Klicken Sie dazu in der Administrationskonsole auf Betriebsbedingte Policys > Autonome Controller > Vitalitäts-Controller und wählen Sie die beiden Registerkarten "Konfiguration" und "Laufzeit" aus. Der Controller für Vitalitätsüberwachung ist standardmäßig aktiviert.
In der Anzeige "Laufzeittopologie" erscheint kein Symbol für den Vitalitäts-Controller
Überprüfen Sie, ob der Controller für Vitalitätsüberwachung aktiv ist. Führen Sie dazu das wsadmin-Script checkHmmLocation.jacl im Verzeichnis Installationsstammverzeichnis/bin auf Knoten aus, die keine Deployment-Manager-Knoten sind. Dieses Script zeigt die aktuelle Position des Controllers an, wenn dieser aktiv ist. Nähere Informationen finden Sie im Artikel Controller für Vitalitätsüberwachung mit Scripts ermitteln. Außerdem können Sie versuchen, ob Sie mit der Option Aktualisierung der Daten erzwingen auf der Seite "Laufzeittopologie" das Symbol für den Vitalitätscontroller anzeigen können.
Es werden keine Neustarts zugelassen
Überprüfen Sie die Zeiten, zu denen kein Neustart zulässig ist. Klicken Sie dazu in der Administrationskonsole auf Betriebsbedingte Policys > Autonome Controller > Vitalitätscontroller und wählen Sie das Feld Unzulässige Zeiten für Neustart aus. Standardmäßig kann ein Neustart jederzeit durchgeführt werden.
Neustarts folgen zu schnell aufeinander
Überprüfen Sie das Mindestneustartintervall. Klicken Sie dazu in der Administrationskonsole auf Betriebsbedingte Policys > Autonome Controller > Vitalitätscontroller und wählen Sie das Feld Mindestintervall für Neustart aus. Standardmäßig ist kein Mindestintervall für Neustart definiert.
Der Steuerzyklus ist zu lang
Überprüfen Sie die Einstellung Länge des Steuerzyklus. Wählen Sie dazu in der Administrationskonsole Betriebsbedingte Policys > Autonome Controller > Vitalitätscontroller aus und passen Sie den Wert gegebenenfalls an. Der Vitalitätscontroller prüft in regelmäßigen Abständen, ob gegen Policys verstoßen wird. Wenn der Steuerzyklus zu lang ist, werden die Server möglicherweise nicht schnell genug gestartet.
Der Server wurde X Mal hintereinander gestartet, aber trotzdem wird die Vitalitätsbedingung nicht erfüllt.
In diesem Fall gibt X die maximal zulässige Anzahl aufeinanderfolgender Neustarts für den Vitalitätscontroller an. Der Controller für Vitalitätsüberwachung schließt daraus, dass das Problem durch einen Neustart nicht behoben werden kann, und unterbindet einen weiteren Neustart des Servers. Die folgende Nachricht wird im Protokoll aufgezeichnet.

WXDH0011W: Die maximal zulässige Anzahl der Prüffehler für Server Servername wurde überschritten. Neustarts werden inaktiviert.

Der Controller für Vitalitätsüberwachung überwacht den Server weiterhin und zeichnet Nachrichten im Protokoll auf, wenn die Vitalitäts-Policy nicht eingehalten wird. Beispiel:

WXDH0012W: Beim Server Servername, für den Neustarts inaktiviert sind, ist die Vitalitätsprüfung fehlgeschlagen.

Mit den folgenden Aktionen können Sie Neustarts für den Server aktivieren:
  • Controller für Vitalitätsüberwachung inaktivieren und anschließend aktivieren,
  • Einstellung Maximale Anzahl aufeinanderfolgender Neustarts des Controllers anpassen,
  • den folgenden Befehl an der Eingabeaufforderung ausführen:

    wsadmin -profile HmmControllerProcs.jacl enableServer Servername

    Sie finden dieses Script auf Knoten (nicht dem Deployment-Manager-Knoten) im Verzeichnis <Installationsstammverzeichnis>\bin. Dieses Script setzt einen aktiven Deployment Manager voraus.

Einstellungen für Vitalitäts-Policy

Die folgenden Probleme können aufgrund der Einstellungen für Vitalitäts-Policys auftreten:
Der Server ist keiner Vitalitäts-Policy zugeordnet.
Überprüfen Sie, ob die Vitalitäts-Policy-Zugehörigkeit für Ihren Server gültig ist. Klicken Sie dazu in der Administrationskonsole auf Betriebsbedingte Policys > Vitalitäts-Policys.
Der Reaktionsmodus einer dem Server zugeordneten Policy ist "Kontrolliert"
Klicken Sie in der Administrationskonsole auf Laufzeitoperationen > Task-Verwaltung > Laufzeit-Tasks, um Bestätigungsanforderungen für eine Neustartaktion für eine Policy im Modus Kontrolliert zu suchen. Server werden automatisch erneut gestartet, wenn Sie Automatisch als Reaktionsmodus festlegen. Die folgende Nachricht zur kontrollierten Bedingung wird in das Protokoll geschrieben:


WXDH0024I: Der Server Servername hat gegen die Vitalitätsbedingung Name verstoßen. Der Reaktionsmodus ist "Kontrolliert".

Der Server ist ein Member eines statischen Cluster und das einzige aktive Cluster-Member.
Die Vitalitäts-Policy beendet nicht alle Member eines Cluster gleichzeitig. Wenn ein Cluster ein Cluster-Member enthält oder nur ein Cluster-Member aktiv ist, wird der Cluster nicht erneut gestartet.
Der Server ist Member eines dynamischen Cluster, die Anzahl der aktiven Instanzen liegt unter dem Minimum, und der Verteilungscontroller ist inaktiviert.
Überprüfen Sie die Mindestanzahl der erforderlichen Instanzen für den dynamischen Cluster. Klicken Sie dazu in der Administrationskonsole auf Server > Dynamische Cluster. In diesem Fall behandelt die Vitalitätsüberwachung den dynamischen Cluster wie einen statischen Cluster und verwendet den Parameter für die Mindestanzahl der Instanzen.
Der Controller für Vitalitätsüberwachung hat die Policy nicht erhalten.
Der Controller für Vitalitätsüberwachung wird nicht im Deployment Manager ausgeführt, wo die Vitalitäts-Policys erstellt werden. Wenn der Deployment Manager nach dem Start des Controller für Vitalitätsüberwachung erneut gestartet wird, hat der Controller für Vitalitätsüberwachung möglicherweise nicht die neue Policy.
Sie können dieses Problem wie folgt beheben:
  1. Inaktivieren Sie den Controller für Vitalitätsüberwachung. Wählen Sie dazu in der Administrationskonsole das Markierungsfeld Vitalitätsüberwachung aktivieren aus.
  2. Synchronisieren Sie die Konfigurations-Repositorys mit den Backend-Knoten. Klicken Sie in der Administrationskonsole auf Systemverwaltung > Knoten, wählen Sie die zu synchronisierenden Knoten aus und klicken Sie auf Synchronisieren.
  3. Starten Sie den Controller für Vitalitätsüberwachung erneut. Wählen Sie dazu in der Administrationskonsole das Markierungsfeld Vitalitätsüberwachung aktivieren aus.
  4. Synchronisieren Sie die Konfigurations-Repositorys erneut mit den Backend-Knoten.

Interaktionen mit dem Verteilungscontroller

Die folgende Liste beschreibt Probleme, die aufgrund der Interaktionen zwischen dem Controller für die Vitalitätsüberwachung und dem Controller für die Verteilung von Anwendungen auftreten können:
Der Server ist Member eines dynamischen Cluster, aber es kann keine Verbindung zum Verteilungscontroller hergestellt werden.
Für dynamische Cluster-Member prüft die Vitalitätsüberwachung zusammen mit dem Verteilungscontroller, ob ein Server erneut gestartet werden kann. Wenn der Verteilungscontroller zwar aktiv ist, aber nicht erreicht werden kann, erscheint die folgende Nachricht im Protokoll:

WXDH1018E: Es konnte keine Verbindung zum Verteilungscontroller  hergestellt werden: {0}

Vergewissern Sie sich, dass der Verteilungscontroller aktiv ist. Sie können den Verteilungscontroller auf einem der Knoten, die in der Anzeige "Laufzeittopologie" angezeigt werden, oder mit dem Script checkPlacementLocation.jacl suchen.
Der Server ist Member eines dynamischen Cluster, der Verteilungscontroller ist aktiv, und der Verteilungscontroller weist die Vitalitätsüberwachung an, den Server nicht erneut zu starten.
Der Verteilungscontroller kann erfordern, dass die Serverinstanz aktiv bleibt.
Der Server wird gestoppt, aber nicht erneut gestartet
In einem dynamischen Cluster gibt es verschiedene Formen des Neustarts:
  • Sofortiger Neustart (Server stoppen, Server starten).
  • Serverinstanz auf einem anderen Knoten starten und den nicht mehr ordnungsgemäß funktionierenden Server stoppen.
  • Nur den nicht mehr funktionierenden Server stoppen und davon ausgehen, dass die verbleibenden Anwendungsinstanzen den Bedarf decken sollen.
Der Verteilungscontroller bestimmt die Form des Neustarts und gegebenenfalls die Positionen, an denen die neue Instanz gestartet wird. Nach einem Neustart in einem dynamischen Cluster setzt die Vitalitätsüberwachung eine Anforderung an den Verteilungscontroller für eine Neuberechnung der Verteilung ab.

Einstellungen für die Zugehörigkeit zu Knotengruppen

Die folgende Liste beschreibt Probleme, die aufgrund der Einstellungen für die Vitalitätsüberwachung und die Zugehörigkeit zu Knotengruppen auftreten können:
Der Server wird auf einem Knoten ausgeführt, der sich im Wartungsmodus befindet.
Die Vitalitätsüberwachung führt auf Knoten, die sich im Wartungsmodus befinden, keinen Serverneustart durch. Sie können den Wartungsmodus für einen Knoten aufheben, indem Sie auf Systemverwaltung > Knoten > Name_des_Knotens > Wartungsmodus aufheben klicken.

Sensorprobleme

Die folgende Liste beschreibt Probleme, die aufgrund der Einstellungen für die Vitalitätsüberwachung und die Zugehörigkeit zu Knotengruppen auftreten können:
Es werden keine Sensordaten für den Server empfangen
Die Vitalitätsüberwachung kann Verstöße gegen Policys nicht erkennen, wenn sie von den für die Policy erforderlichen Sensoren keine Daten empfängt. Wenn im Steuerzyklus keine Sensordaten empfangen werden, gibt die Vitalitätsüberwachung die folgende Protokollnachricht aus:

WXDH3001E: Es wurden keine PMI-Prüfdaten im Steuerzyklus vom Server Servername für die Vitalitätsklasse healthpolicy empfangen.

Für Antwortzeitbedingungen empfängt die Vitalitätsüberwachung Daten vom On Demand Router (ODR). Es werden erst dann Daten für diese Bedingungen generiert, wenn Anforderungen über den ODR gesendet werden.



Related tasks
Vitalitätsüberwachung definieren

Referenzartikel    

Nutzungsbedingungen | Feedback Letzte Aktualisierung: Mar 23, 2006 9:53:15 AM EST
http://publib.boulder.ibm.com/infocenter/wxdinfo/v6r0/index.jsp?topic=?topic=/com.ibm.websphere.xd.doc/info/odoe_task/rodhealthfail.html

© Copyright IBM 2005, 2006. Alle Rechte vorbehalten.
Dieses Information Center beruht auf der Eclipse-Technologie. (http://www.eclipse.org)