Erkennungs- und Fehlererkennungsprotokolle der Stammgruppe

Wenn ein Stammgruppenmember gestartet wird, gibt es keine Verbindungen zu anderen Stammgruppenmembern. Wenn eine Stammgruppe für die Ausführung mit den Standarderkennungs- und Standardfehlererkennungsprotokollen oder mit einem alternativen Protokollprovider konfiguriert ist, werden entweder die Erkennungs- und Fehlererkennungstasks oder die Tasks des alternativen Protokollproviders als Teil der Prozessstartprozedur ausgeführt. Diese Tasks stellen die Konnektivität zu anderen Stammgruppenmembern her, überwachen diese Konnektivität und behandeln Konnektivitätsfehler für dieses Stammgruppenmember in zeitlich festgelegten Intervallen, solange das Stammgruppenmember aktiv ist.

Das Standarderkennungsprotokoll

Anmerkung: Dieser Artikel referenziert eine oder mehrere Protokolldateien des Anwendungsservers. Alternativ dazu wird empfohlen, den Server so zu konfigurieren, dass er die HPEL-Protokoll- und -Traceinfrastruktur (High Performance Extensible Logging) verwendet und nicht die Dateien SystemOut.log , SystemErr.log, trace.log und activity.log auf verteilten oder IBM® i-Systemen. Sie können HPEL auch in Verbindung mit Ihren nativen z/OS-Protokolleinrichtungen verwenden. Wenn Sie HPEL verwenden, können Sie mit dem Befehlszeilentool LogViewer im Verzeichnis "bin" des Serverprofils auf alle Ihre Protokoll- und Tracedaten zugreifen. Weitere Informationen zur Verwendung von HPEL finden Sie in der Dokumentation zum Einsatz von HPEL für die Fehlerbehebung in Anwendungen.

Das Standarderkennungsprotokoll stellt die Netzkonnektivität zu den anderen Membern der Stammgruppe her. Dazu ruft das Erkennungsprotokoll die Liste der Stammgruppenmember und der zugeordneten Netzinformationen aus den Konfigurationseinstellungen des Produkts ab. Dann versucht das Erkennungsprotokoll, Netzverbindungen zu allen anderen Stammgruppenmembern zu öffnen. In regelmäßigen Abständen berechnet das Erkennungsprotokoll die Gruppe der nicht verbundenen Member erneut und versucht, Verbindungen zu diesen Membern zu öffnen.

Wenn eine Verbindung zu einem anderen Stammgruppenmember hergestellt wird, benachrichtigt das Erkennungsprotokoll das View-Synchrony-Protokoll und protokolliert dieses Ereignis als Informationsnachricht in der Datei SystemOut.log.
DCSV1032I: DCS-Stack DefaultCoreGroup bei Member MyCell\anzio\nodeagent: Die Verbindung zum definierten Member MyCell\anzioCellManager\dmgr wurde hergestellt.

Verbindungen können jederzeit aus mehreren Gründen fehlschlagen. Das Fehlerermittlungsprotokoll ermittelt Verbindungsfehler und benachrichtigt das Erkennungsprotokoll. Das Erkennungsprotokoll versucht dann, beim nächsten geplanten Intervall eine neue Netzverbindung zu diesem Member herzustellen.

Die Menge der CPU-Zyklen, die die Erkennungsprotokolltask verbraucht, ist proportional zu der Anzahl von Stammgruppenmembern, die gestoppt werden oder nicht erreichbar sind. Wenn die Standardeinstellungen gesetzt sind, ist die Menge der CPU-Zyklen, die die Erkennungsprotokolltask verbraucht, vernachlässigbar.

Standardfehlererkennungsprotokoll

Das Fehlererkennungsprotokoll überwacht die Netzverbindungen der Stammgruppe, die das Erkennungsprotokoll herstellt. Wenn das Fehlererkennungsprotokoll eine fehlgeschlagene Netzverbindung ermittelt, meldet es den Fehler an das View-Synchrony-Protokoll und das Erkennungsprotokoll. Das View-Synchrony-Protokoll schließt das fehlerhafte Member aus der View aus. Das Erkennungsprotokoll versucht, eine Netzverbindung mit dem fehlerhaften Member erneut herzustellen.Diese Task wird ausgeführt, so lange das Member aktiv ist.

Das Fehlererkennungsprotokoll verwendet zwei verschiedene Verfahren zur Ermittlung fehlerhafter Member:
Es sucht nach Verbindungen, die geschlossen wurden, weil der zugehörige Socket geschlossen wurde.

Wenn ein Stammgruppenmember bei der Reaktion auf einen Verwaltungsbefehl auf normalem Wege gestoppt wird, wird der Transport der Stammgruppe für dieses Member ebenfalls gestoppt, und auch der dem Transport zugeordnete Socket wird geschlossen. Wird ein Stammgruppenmember fehlerhaft beendet, schließt das zugrunde liegende Betriebssystem normalerweise die Sockets, die vom Prozess geöffnet wurden, sowie die Sockets, die dem Transport der Stammgruppe zugeordnet sind.

Bei beiden Beendigungstypen werden Stammgruppenmember, die eine offene Verbindung zum beendeten Member haben, darüber benachrichtigt, dass die Verbindung nicht mehr verwendbar ist. Das Stammgruppenmember, das die Benachrichtigung über den geschlossenen Socket empfängt, behandelt das beendete Member als fehlerhaftes Member.

Wird aufgrund des Mechanismus zum Schließen des Sockets ein fehlgeschlagenes Member festgestellt, wird für die übrigen Member die folgende Nachricht in der Datei SystemOut.log protokolliert:
DCSV1115W: DCS-Stack DefaultCoreGroup bei Member anzioCell01\anzio\ServerD:
Die Verbindung zum Member anzioCell01\anzio\ServerC wurde geschlossen. Das Member wird aus der Ansicht entfernt.
Der DCS-Verbindungsstatus ist Discovery|Ptp, transmitter closed.

Fehlerhafte Member werden normalerweise mit dem Verfahren der geschlossenen Sockets ermittelt. TCP-Einstellungen im zugrunde liegenden Betriebssystem, z. B. FIN_WAIT, haben Einfluss darauf, wie schnell Schließereignisse für Sockets empfangen werden.

Es überwacht aktive Überwachungssignale der Stammgruppenmember.

Das aktive Verfahren mit Überwachungssignalen verhält sich analog zur Keep-Alive-Funktion von TCP. Jedes Stammgruppenmember sendet in regelmäßigen Abständen für jede offene Verbindung der Stammgruppe ein Ping-Paket. Die Rate oder Periodizität, mit der das Paket gesendet wird, ist der Zeitraum für Übertragung des Überwachungssignals.

Jedes Stammgruppenmember erwartet, an jeder offenen Verbindung ein Paket vom Stammgruppenmember am anderen Ende der Verbindung zu empfangen. Werden während der als "Zeitlimitintervall für Überwachungssignal" festgelegten Zeit keine Pakete über eine offene Verbindung empfangen, wird das Member am anderen Ende der Verbindung als "fehlerhaft" gekennzeichnet.

Das Zeitlimitintervall für das Überwachungssignal muss eine ganze Zahl sein, d. h. ein Vielfaches des Zeitraums für die Übertragung des Überwachungssignals. Außerdem muss das Zeitlimitintervall für das Überwachungssignal mindestens doppelt so groß wie der Zeitraum für die Übertragung des Überwachungssignals sein.

Wenn ein Member als "fehlerhaft" gekennzeichnet wird, wird eine Nachricht wie die folgende protokolliert:
DCSV1112W: DCS-Stack DefaultCoreGroup bei Member anzioCell01\anzioCellManager01\dmgr:
Fehlerverdächtiges Member ist anzioCell01\nettuno\ServerB aufgrund von Zeitlimit für Überwachungssignal.
Das konfigurierte Zeitlimit sind 180000 Millisekunden. Der logische DCS-Kanal ist Connected|Ptp.

Aktive Überwachungssignale sind sehr gut geeignet, um Stammgruppenmember zu ermitteln, die unerreichbar sind, weil das Netz gestoppt wurde. Aktive Überwachungssignale verbrauchen CPU-Ressourcen. Der Umfang der verbrauchten CPU-Ressourcen ist proportional zur Anzahl der aktiven Member in der Stammgruppe. Die Standardkonfiguration für aktive Überwachungssignale hält die Waage zwischen CPU-Belastung und rechtzeitiger Erkennung fehlerhafter Member.

Sie können die Administrationskonsole oder das Tool wsadmin verwenden, um den Zeitraums für die Übertragung des Überwachungssignals und das Zeitlimitintervall für das Überwachungssignal zu konfigurieren. Eine Beschreibung dazu, wie Sie diese Einstellungen über die Administrationskonsole ändern können, finden Sie im Artikel Fehlererkennungsprotokoll für eine Stammgruppe konfigurieren.

[IBM i][AIX Solaris HP-UX Linux Windows]

Alternative Protokollprovider

Derzeit sind für IBM i und verteilte Plattformen keine alternativen Protokollprovider verfügbar.

Alternative Protokollprovider

Anstelle des Standarderkennungsprotokolls und des Standardfehlererkennungsprotokolls kann ein alternativer Protokollprovider verwendet werden, um die Kommunikation zwischen Stammgruppenmembern zu überwachen und zu verwalten. Im Allgemeinen verbrauchen alternative Protokollprovider, wie z. B. der z/OS-XCF-basierte Provider (Cross-system Coupling Facility), weniger Systemressourcen als das Standarderkennungsprotokoll und das Standardfehlererkennungsprotokoll, insbesondere bei Inaktivität der Stammgruppenmember. Ein alternativer Protokollprovider benötigt weniger Systemressourcen, weil er keine TCP/IP-Überprüfung mittels Pingsignal zwischen den Membern ausführt, während die Standardprotokollprovider dies verwenden, um festzustellen, ob ein Stammgruppenmember noch aktiv ist.

[z/OS]Wenn Sie den z/OS-XCF-basierten Protokollprovider (Cross-system Coupling Facility) verwenden möchten, sollten Sie wissen, dass der Serverprozess beim Start als Member zu einer XCF-Gruppe hinzugefügt wird. Die XCF-Gruppe enthält alle aktiven Member für die Stammgruppe. XCF benachrichtigt alle Member, wenn ein weiteres Member zur Gruppe hinzugefügt wird und wenn zu einem Member kein Kontakt mehr hergestellt werden kann, weil der Server heruntergefahren wurde oder weil XCF feststellt, dass der Serverprozess beendet wurde. Wenn eine Verbindung zwischen Stammgruppenmembern hergestellt wird, benachrichtigt der XCF-basierte (z/OS Cross-system Coupling Facility) Protokollprovider das View-Synchrony-Protokoll und protokolliert dieses Ereignis als Informationsnachricht ähnlich der folgenden Nachricht in der Datei SystemOut.log.
DCSV1032I: DCS-Stack DefaultCoreGroup bei Member MyCell\anzio\nodeagent: Die Verbindung zum definierten Member MyCell\anzioCellManager\dmgr wurde hergestellt.
Bevor eine bestimmte Stammgruppe für die Verwendung eines alternativen Protokollproviders rekonfiguriert wird, müssen Sie sicherstellen, dass die Stammgruppe folgende Voraussetzungen erfüllt. Wenn die Stammgruppe nicht alle diese Voraussetzungen erfüllt, müssen Sie weiterhin das Standarderkennungsprotokoll und das Standardfehlererkennungsprotokoll mit dieser Stammgruppe verwenden.
  • Die Stammgruppe ist homogen. Dies bedeutet, dass die Stammgruppenprozesse alle auf derselben Plattform enthalten sein müssen. Beispielsweise darf die Stammgruppe nicht gleichzeitig z/OS-Prozesse und verteilte Prozesse enthalten.

    [z/OS]Wenn die Stammgruppe Nicht-z/OS-Prozesse enthält oder wenn sie Member mit unterschiedlichen Versionsständen des Produkts enthält, dann kann XCF für diese Stammgruppe nicht verwendet werden.

  • Wenn mittels eines Stammgruppenbrückenservice eine Brücke zwischen der Stammgruppe und einer anderen Stammgruppe aufgebaut werden soll, dann sind alle Stammgruppen, die über die Brücke mit dieser Stammgruppe verbunden sind, ebenfalls homogene Stammgruppen.
  • Auf allen Membern der Stammgruppe muss Version 7.x des Produkts installiert sein. Wenn Member der Stammgruppe mit Version 6.x des Produkts ausgeführt werden, müssen Sie sie auf Version 7.x aktualisieren, bevor Sie zum alternativen Protokollprovider wechseln können.

Symbol, das den Typ des Artikels anzeigt. Konzeptartikel



Symbol für Zeitmarke Letzte Aktualisierung: 25.05.2016
http://www14.software.ibm.com/webapp/wsbroker/redirect?version=cord&product=was-nd-mp&topic=crun_ha_discovery
Dateiname:crun_ha_discovery.html