Sie können das Intervall, in dem das System nach ausgefallenen Servern sucht,
mit der Einstellung für das Intervall der Überwachungssignale konfigurieren.
Die Option -heartbeat ist ein Parameter für den Befehl
startOGserver und gilt nur für Katalogserver.
Informationen zu diesem Vorgang
Die Konfiguration des Failovers variiert je nach Typ der verwendeten Umgebung.
Wenn Sie eine eigenständige Umgebung verwenden, können Sie das Failover über die Befehlszeile
konfigurieren.
Wenn Sie eine Umgebung mit
WebSphere Application Server Network Deployment
verwenden, müssen Sie das Failover über die Administrationskonsole
von
WebSphere Application Server Network Deployment
konfigurieren.
Vorgehensweise
- Failover für eigenständige Umgebungen konfigurieren
Sie können die Intervalle der Überwachungssignale über die Befehlszeile mit dem Parameter
-heartbeat in der Scriptdatei startOgServer konfigurieren.
Setzen Sie den Parameter auf einen der folgenden Werte:
Tabelle 1. Intervall der ÜberwachungssignaleWert |
Aktion |
Beschreibung |
0 |
Typisch (Standardeinstellung) |
Failover werden gewöhnlich innerhalb von 30 Sekunden erkannt. |
-1 |
Aggressiv |
Failover werden gewöhnlich innerhalb von 5 Sekunden erkannt. |
1 |
Gelockert |
Failover werden gewöhnlich innerhalb von 180 Sekunden erkannt. |
Ein aggressives
Intervall der Überwachungssignale kann hilfreich sein, wenn die Prozesse und das Netz stabil sind.
Wenn das Netz oder die Prozesse nicht optimal konfiguriert sind,
können Überwachungssignale verpasst werden, was zu einer falschen Fehlererkennung führen kann.
- Failover für Umgebungen mit WebSphere Application
Server konfigurieren
Sie können
WebSphere Application Server Network Deployment Version
6.0.2 und höher so konfigurieren, dass ein schnelles Failover von
WebSphere eXtreme Scale unterstützt wird.
Die Standard-Failover-Zeit für permanente Fehler sind 200 Sekunden.
Ein permanenter Fehler ist ein physischer Computer- oder Serverabsturz, das Ziehen des Netzkabels oder ein
Betriebssystemfehler.
Bei Fehlern aufgrund von Prozessabstürzen oder temporären Fehlern findet das Failover gewöhnlich
in weniger als einer Sekunde statt.
Die Fehlererkennung für temporäre Fehler findet statt, wenn die Netz-Sockets
des inaktiven Prozesses für den Server, in dem der Prozess ausgeführt wird, automatisch vom Betriebssystem geschlossen werden.
Überwachungssignalkonfiguration für Stammgruppen
Wenn WebSphere eXtreme Scale
in einem Prozess von WebSphere Application
Server
ausgeführt wird, werden die Failover-Merkmale aus den Stammgruppeneinstellungen des Anwendungsservers
übernommen.
In den folgenden Abschnitten wird beschrieben, wie Sie die Überwachungssignaleinstellungen der Stammgruppe
für verschiedene Versionen von WebSphere Application
Server Network Deployment konfigurieren:
- Stammgruppeneinstellungen für WebSphere Application Server Network Deployment Version
6.x und 7.x aktualisieren
Geben Sie das Intervall der Überwachungssignale
in WebSphere Application
Server Version
6.0 bis Version 6.1.0.12 in Sekunden und ab Version
6.1.0.13 in Millisekunden an. Außerdem müssen Sie die Anzahl verpasster Überwachungssignale angeben.
Dieser Wert gibt an, wie viele Überwachungssignale verpasst werden können, bevor
eine Peer-JVM als ausgefallen betrachtet wird.
Die Erkennungszeit für permanente Fehler entspricht in etwa dem Produkt aus Intervall der Überwachungssignale
und Anzahl verpasster Überwachungssignale.
Diese Eigenschaften werden mit Hilfe von angepassten Eigenschaften
in der Stammgruppe über die WebSphere-Administrationskonsole
angegeben.
Einzelheiten zur Konfiguration finden Sie im Abschnitt
Angepasste Eigenschaften der Stammgruppe.
Diese Eigenschaften müssen für alle Stammgruppen angegeben werden, die von Anwendungen
verwendet werden:
- Das Intervall der Überwachungssignale wird mit der angepassten Eigenschaft IBM_CS_FD_PERIOD_SEC
(in Sekunden) bzw. der angepassten Eigenschaft IBM_CS_FD_PERIOD_MILLIS (in Millisekunden)
(erfordert Version 6.1.0.13 oder höher) angegeben.
- Die Anzahl verpasster Überwachungssignale wird mit der angepassten Eigenschaft IBM_CS_FD_CONSECUTIVE_MISSED
angegeben.
Der Standardwert für die Eigenschaft IBM_CS_FD_PERIOD_SEC
ist 20, und der Standardwert für die Eigenschaft IBM_CS_FD_CONSECUTIVE_MISSED ist 10. Wenn Sie
die Eigenschaft IBM_CS_FD_PERIOD_MILLIS angeben, überschreibt diese jede definierte angepasste
Eigenschaft IBM_CS_FD_PERIOD_SEC. Die Werte dieser Eigenschaften sind positive ganze Zahlen.
Verwenden Sie die folgenden Einstellungen, um eine Erkennungszeit von
1500 ms für Server der
WebSphere Application Server Network Deployment Version
6.x zu erzielen:
- Setzen Sie IBM_CS_FD_PERIOD_MILLIS = 750 (WebSphere Application Server Network Deployment Version 6.1.0.13
und höher).
- Setzen Sie IBM_CS_FD_CONSECUTIVE_MISSED = 2.
Stammgruppeneinstellungen für WebSphere Application Server Network Deployment Version
7.0 aktualisieren
WebSphere Application Server Network Deployment Version
7.0 stellt zwei Stammgruppeneinstellungen bereit, die angepasst werden können, um die Failover-Erkennungszeit
zu erhöhen oder zu verringern:
- Übertragungsintervall für Überwachungssignale. Der Standardwert sind 30.000 Millisekunden.
- Überwachungssignalzeitlimit. Der Standardwert sind 180.000 Millisekunden.
Weitere Einzelheiten zum Ändern dieser Einstellungen finden Sie im Information Center von
WebSphere Application Server Network Deployment unter "Einstellungen für die Erkennung und Fehlererkennung".
Verwenden Sie die folgenden
Einstellungen, um eine Fehlererkennungszeit von 1500 ms für Server der
WebSphere Application Server Network Deployment Version
7 zu erzielen:
- Setzen Sie das Übertragungsintervall für Überwachungssignale auf 750 Millisekunden.
- Setzen Sie das Überwachungssignalzeitlimit auf 1500 Millisekunden.
Nächste Schritte
Wenn Sie diese Einstellungen ändern, um kürzere
Failover-Zeiten anzugeben, müssen verschiedene Probleme bei der Systemoptimierung
beachtet werden.
Java ist keine Echtzeitumgebung.
Es ist möglich, dass Threads verzögert werden, wenn die JVM
lange Garbage-Collection-Zeiten verzeichnet.
Threads können auch verzögert werden, wenn die Maschine, auf der die JVM ausgeführt wird, unter hoher Last steht (durch die
JVM selbst oder durch
andere Prozesse, die auf der Maschine ausgeführt werden).
Wenn Threads verzögert werden, werden Überwachungssignale möglicherweise nicht rechtzeitig gesendet.
Im schlimmsten Fall werden die durch die erforderliche Failover-Zeit verzögert.
Wenn Threads verzögert werden, treten falsche Fehlererkennungen auf.
Das System muss optimiert und dimensioniert werden, um sicherzustellen, dass falsche Fehlererkennungen in der Produktionsumgebung
nicht auftreten.
Dies kann am Zuverlässigsten durch angemessene Lasttests sichergestellt werden.
Anmerkung: Die aktuelle
Version von eXtreme Scale unterstützt WebSphere Real
Time.