![[AIX Solaris HP-UX Linux Windows]](../images/dist.gif)
![[z/OS]](../images/ngzos.gif)
Intelligent Management: Fehlerbehebung für Vitalitätsüberwachung
Wenn die Vitalitätsüberwachung gar nicht oder nicht wie erwartet funktioniert, können Sie prüfen, ob einer der im folgenden Abschnitt erläuterten Fehler vorliegt.
Die richtigen Protokolle finden
Der Vitalitätscontroller ist eine verteilte Ressource, die vom High Availability Manager (HA-Manager) verwaltet wird. Er ist in allen Node-Agent- und Deployment-Manager-Prozessen vorhanden und in einem dieser Prozesse aktiv. Wenn ein Prozess ausfällt, wird der Controller in einem anderen Node-Agent- oder Deployment-Manager-Prozess aktiviert.
Klicken Sie in der Administrationskonsole auf
, um festzustellen, ob der Vitalitätscontroller aktiv ist. Die Position und der Stabilitätsstatus des Vitalitätscontrollers werden angezeigt.Performance Advisor ist für die vordefinierte Vitalitätsrichtlinie für Speicherverluste aktiviert.
Die vordefinierte Vitalitätsrichtlinie für Speicherverluste verwendet die Funktionalität des Performance Advisor, daher wird der Performance Advisor aktiviert, wenn dieser Richtlinie Member zugeordnet werden. Zum Inaktivieren des Performance Advisor muss entweder diese Vitalitätsrichtlinie entfernt oder die Zugehörigkeit zur Vitalitätsrichtlinie eingegrenzt werden. Wenn Sie die Vitalitätsrichtlinie für künftige Verwendung beibehalten möchten, könnten Sie die Richtlinie für Speicherverlust beibehalten, aber alle ihre Member entfernen. Zum Ändern der Member klicken Sie auf . Sie können die Zugehörigkeiten zur Vitalitätsrichtlinie bearbeiten, indem Sie der Richtlinie bestimmte Member hinzufügen oder diese Member entfernen.Einstellungen für den Vitalitätscontroller
Die folgende Liste beschreibt Probleme, die aufgrund der Einstellungen des Vitalitätscontrollers auftreten können:- Vitalitätscontroller ist inaktiviert
- Zum Überprüfen der Einstellung klicken Sie in der Administrationskonsole auf Konfiguration und Laufzeit aus. Der Vitalitätscontroller ist standardmäßig aktiviert. , und wählen Sie dann die Register
- Es werden keine Neustarts zugelassen
- Klicken Sie in der Administrationskonsole auf Unzulässige Zeiten für Neustart. Standardmäßig kann ein Neustart jederzeit durchgeführt werden. , und wählen Sie dann das Feld
- Neustarts folgen zu schnell aufeinander
- Zum Überprüfen des Mindestneustartintervalls klicken Sie in der Administrationskonsole auf Mindestintervall für Neustart. Standardmäßig ist kein Mindestintervall definiert. , und ändern Sie dann den Wert im Feld
- Der Steuerzyklus ist zu lang
- Zum Überprüfen der Steuerzykluslänge klicken Sie in der Administrationskonsole auf , und passen Sie dann ggf. den Wert an. Der Vitalitätscontroller prüft in regelmäßigen Abständen, ob gegen Richtlinien verstoßen wird. Wenn der Steuerzyklus zu lang ist, werden die Server möglicherweise nicht schnell genug gestartet.
- Der Server wurde X Mal hintereinander gestartet, aber trotzdem wird die Vitalitätsbedingung nicht erfüllt
- In diesem Fall gibt X die maximal zulässige Anzahl aufeinanderfolgender Neustarts für den Vitalitätscontroller an. Der Vitalitätscontroller schließt daraus, dass das Problem durch einen Neustart nicht behoben werden kann, und unterbindet einen weiteren Neustart des Servers. Die folgende Nachricht wird im Protokoll angezeigt:
WXDH0011W: Die maximal zulässige Anzahl der Prüffehler für Server Servername wurde überschritten. Neustarts werden inaktiviert.
Der Vitalitätscontroller überwacht den Server weiterhin und zeichnet Nachrichten im Protokoll auf, wenn die Vitalitätsrichtlinie nicht eingehalten wird. Beispiel:WXDH0012W: Beim Server Servername, für den Neustarts inaktiviert sind, ist die Vitalitätsprüfung fehlgeschlagen.
Mit den folgenden Aktionen können Sie Neustarts für den Server aktivieren:- Vitalitätscontroller inaktivieren und anschließend aktivieren,
- Einstellung Maximale Anzahl aufeinanderfolgender Neustarts des Controllers anpassen,
- den folgenden Befehl an der Eingabeaufforderung ausführen:
Dieses Script ist im Verzeichnis <Stammverzeichnis_des_Anwendungsservers>\bin auf den Node-Agent- bzw. Deployment-Manager-Knoten verfügbar. Dieses Script setzt einen aktiven Deployment Manager voraus.wsadmin -profile HmmControllerProcs.jacl enableServer Servername
Einstellungen für Vitalitätsrichtlinie
Die folgenden Probleme können aufgrund der Einstellungen für Vitalitätsrichtlinien auftreten:- Der Server ist keiner Vitalitätsrichtlinie zugeordnet
- Klicken Sie in der Administrationskonsole auf , um sicherzustellen, dass die Vitalitätsrichtlinienzugehörigkeiten für Ihren Server gültig sind.
- Der Reaktionsmodus einer dem Server zugeordneten Richtlinie ist "Kontrolliert"
- Klicken Sie in der Administrationskonsole auf Kontrolliert.
Server werden automatisch erneut gestartet, wenn Sie den Reaktionsmodus auf
Automatisch setzen. Die folgende Nachricht zur kontrollierten Bedingung wird in das Protokoll geschrieben:
WXDH0024I: Der Server Servername hat gegen die Vitalitätsbedingung Vitalitätsrichtlinie verstoßen. Der Reaktionsmodus ist "Kontrolliert".
. Suchen Sie die
Genehmigungsanforderungen für eine Neustartaktion für eine Richtlinie im Modus
- Der Server ist ein Member eines statischen Clusters und das einzige aktive Cluster-Member
- Die Vitalitätsrichtlinie beendet nicht alle Member eines Clusters gleichzeitig. Wenn ein Cluster ein Cluster-Member enthält oder nur ein Cluster-Member aktiv ist, wird der Cluster nicht erneut gestartet.
- Der Server ist Member eines dynamischen Cluster, die Anzahl der aktiven Instanzen liegt unter dem Mindestwert, und der Verteilungscontroller ist inaktiviert.
- Zum Überprüfen der Mindestanzahl der erforderlichen Instanzen für den dynamischen Cluster klicken Sie in der Administrationskonsole auf . In diesem Fall behandelt die Vitalitätsüberwachung den dynamischen Cluster wie einen statischen Cluster und verwendet die Parameter für die Mindestanzahl der Instanzen.
- Der Vitalitätscontroller hat die Richtlinie nicht erhalten
- Der Vitalitätscontroller wird nicht im Deployment Manager
ausgeführt, wo die Vitalitätsrichtlinien erstellt werden. Wenn der Deployment Manager nach dem Start des Vitalitätscontrollers
erneut gestartet wird, hat der Vitalitätscontroller möglicherweise nicht die neue Richtlinie.
Sie können das Problem wie folgt beheben:
- Inaktivieren Sie den Vitalitätscontroller. Klicken Sie in der Administrationskonsole auf .
- Synchronisieren Sie die Konfigurationsrepositorys mit den Back-End-Knoten. Klicken Sie in der Administrationskonsole auf Synchronisieren. . Wählen Sie die zu synchronisierenden Knoten aus, und klicken Sie anschließend auf
- Starten Sie den Vitalitätscontroller erneut. Klicken Sie in der Administrationskonsole auf .
- Synchronisieren Sie die Konfigurationsrepositorys mit den Back-End-Knoten. Klicken Sie in der Administrationskonsole auf Synchronisieren. . Wählen Sie die zu synchronisierenden Knoten aus, und klicken Sie anschließend auf
Interaktionen des Controllers für die Verteilung von Anwendungen
Die folgende Liste beschreibt Probleme, die aufgrund der Interaktionen zwischen dem Controller für die Vitalitätsüberwachung und dem Controller für die Verteilung von Anwendungen auftreten können:
- Der Server ist Member eines dynamischen Cluster, aber es kann keine Verbindung zum Verteilungscontroller hergestellt werden
- Für dynamische Cluster-Member prüft die Vitalitätsüberwachung zusammen mit dem Controller für die Verteilung von Anwendungen,
ob ein Server erneut gestartet werden kann.
Wenn der Controller für die Verteilung von Anwendungen
zwar aktiv ist, aber nicht erreicht werden kann, erscheint die folgende Nachricht im Protokoll:
Vergewissern Sie sich, dass der Verteilungscontroller aktiv ist. Klicken Sie in der Administrationskonsole auf , um festzustellen, ob der Vitalitätscontroller aktiv ist. Die Position und der Stabilitätsstatus des Vitalitätscontrollers werden angezeigt. Der Vitalitätscontroller protokolliert Nachrichten in dem Node Agent oder Deployment Manager, der durch die aktuelle Position angegeben ist.WXDH1018E: Es konnte keine Verbindung zum Verteilungscontroller hergestellt werden.
- Der Server wird gestoppt, aber nicht erneut gestartet
- In einem dynamischen Cluster gibt es verschiedene Formen des Neustarts:
- Sofortiger Neustart (Server stoppen, Server starten). Anmerkung: Dieser Neustart findet immer statt, wenn ein dynamischer Cluster im manuellen Modus ausgeführt wird.
- Serverinstanz auf einem anderen Knoten starten und den nicht mehr ordnungsgemäß funktionierenden Server stoppen.
- Nur den nicht mehr funktionierenden Server stoppen und davon ausgehen, dass die verbleibenden Anwendungsinstanzen den Bedarf decken sollen.
- Sofortiger Neustart (Server stoppen, Server starten).
Sensorprobleme
Die folgende Liste beschreibt Probleme, die aufgrund der Einstellungen für die Vitalitätsüberwachung und die Zugehörigkeit zu Knotengruppen auftreten können:
- Es werden keine Sensordaten für den Server empfangen
- Die Vitalitätsüberwachung kann Verstöße gegen Richtlinien nicht erkennen, wenn sie von den für die Richtlinie erforderlichen Sensoren keine Daten empfängt.
Wenn im Steuerzyklus keine Sensordaten empfangen werden, gibt die Vitalitätsüberwachung die folgende Protokollnachricht aus:
Für Antwortzeitbedingungen empfängt die Vitalitätsüberwachung Daten vom On Demand Router (ODR). Es werden erst dann Daten für diese Bedingungen generiert, wenn Anforderungen über den ODR gesendet werden.WXDH3001E: Es wurden keine PMI-Prüfdaten im Steuerzyklus vom Server Servername für die Vitalitätsklasse healthpolicy empfangen.
Taskverwaltungsstatus
Manchmal ändert sich der Status Neustartaktion in Fehlgeschlagen oder Unbekannt. Dieser Fall kann eintreten, wenn der Server nicht während der standardmäßig definierten Zeit stoppt oder wenn das Zeitlimit für die Task erreicht wird. Verwenden Sie die folgende Eigenschaft auf Zellenebene, um das Zeitlimit für Ihre Umgebung anzupassen: HMM.StopServerTimeout. Der Wert wird in Millisekunden angegeben. Der Standardwert ist "10000". Mithilfe dieser Eigenschaft kann die Vitalitätsüberwachung die Wartezeit für die Benachrichtigungen zum Serverstopp verlängern, die von der On Demand-Konfiguration empfangen werden.Wenn Sie das Zeitlimit für Ihre Umgebung erhöhen möchten, klicken Sie auf
. Der Standardwert ist 5 Minuten. Die Task für den Neustart startet nach Ablauf der doppelten angegebenen Zeit, damit der Server stoppen und starten kann.