Automatische und manuelle Peerwiederherstellung von Transaktionen
Der Dateisystemtyp ist der bestimmende Faktor bei der Entscheidung, welche Art der Peerwiederherstellung von Transaktionen verwendet werden soll. Die verschiedenen Dateisysteme haben unterschiedliche Verhaltensweisen, insbesondere das Dateisperrverhalten ist wichtig, wenn die Entscheidung getroffen werden soll zwischen automatischer und manueller Peerwiederherstellung.
Die HA-Unterstützung von WebSphere Application Server verwendet ein Überwachungssignalverfahren, um festzustellen, ob Server noch aktiv sind. Ein gilt als ausgefallen, wenn er nicht mehr auf Überwachungssignalanforderungen reagiert. Einige Szenarien, z. B. bei Systemüberlastung und bei Einsatz von Netzpartitionierung (an anderer Stelle in diesem Artikel erläutert), können bewirken, dass Server nicht mehr auf Überwachungssignale reagieren, obwohl die Server immer noch aktiv sind. WebSphere Application Server verwendet die Technologie der Dateisperrung, um zu verhindern, dass solche Ereignisse gleichzeitige Zugriffe auf Wiederherstellungsprotokolle von Transaktionen auslösen, denn wenn mehrere Server auf ein Wiederherstellungsprotokoll zugreifen, kann das einen Verlust der Datenintegrität zur Folge haben.
Allerdings stellen nicht alle Dateisysteme die notwendige Semantik für Dateisperren bereit. Insbesondere werden Dateisperren bei einem Serverausfall nicht immer aufgehoben. Beispielsweise ermöglicht Network File System Version 4 (NFSv4) diese Freigabe, Network File System Version 3 (NFSv3) jedoch nicht.
Sie können den Test "File System Locking Protocol Test for WebSphere Application Server" ausführen, um zu testen, ob ein gemeinsam genutztes Dateisystem das Failover für Transaktionsprotokolle unterstützen kann. Informationen zum Ausführen des Tests finden Sie auf der Website http://www-01.ibm.com/support/docview.wss?uid=swg24010222.
NFSv4 hebt Sperren, die für einen Host gehalten werden, auf, wenn dieser Host ausfällt. Die Peerwiederherstellung kann automatisch ohne erneutes Starten der ausgefallenen Hardware stattfinden. Daher ist diese NFS-Version besser für die Verwendung der automatischen Peerwiederherstellung geeignet.
NFSv3 hält Dateisperren für einen einen ausgefallenen Host, bis dieser Host erneut gestartet werden kann. In diesem Kontext ist der Host die physische Maschine, auf der der Anwendungsserver, der die Sperre angefordert hat, ausgeführt wird. Außerdem wird die Aufhebung der Sperren durch den Neustart des Hosts und nicht des Anwendungsservers ausgelöst.
- Server H wird auf Host H ausgeführt und hält eine exklusive Dateisperre für seine eigenen Protokolldateien für die Wiederherstellung.
- Server P wird auf Host P ausgeführt und hält eine exklusive Dateisperre für seine eigenen Protokolldateien für die Wiederherstellung.
- Host H fällt aus und bewirkt auch den Ausfall von Server H. Der NFS Lock Manager auf dem Dateiserver hält die Sperren, die Server H in seinem Namen zugeteilt werden.
- WebSphere Application Server löst in Server P für Server H ein Peerwiederherstellungsereignis aus.
- Server P versucht vergeblich, eine exklusive Dateisperre für dieses Peerwiederherstellungsprotokoll abzurufen, da die Sperre für Server H gehalten wird. Der Peerwiederherstellungsprozess wird blockiert.
- Zu einem nicht angegebenen Zeitpunkt wird Host H erneut gestartet. Die für Host H gehaltenen Sperren werden aufgehoben.
- Der Peerwiederherstellungsprozess in Server P wird freigegeben und erhält die exklusiven Dateisperren, die für die Ausführung der Peerwiederherstellung erforderlich sind.
- Die Peerwiederherstellung wird in Server P für Server H durchgeführt.
- Server H wird erneut gestartet.
- Wenn die Peerwiederherstellung in Server P noch andauert, wird die Wiederherstellung gestoppt.
- Server P hebt die exklusive Sperre der Wiederherstellungsprotokolle auf und gibt das Eigentumsrecht an den Wiederherstellungsprotokollen an Server H zurück.
- Server H erhält die exklusive Sperre und kann jetzt die Standardprotokollierung von Transaktionen durchführen.
Aufgrund dieses Verhaltens müssen Sie auf NFSv3 die Dateisperrung inaktivieren, um die automatische Peerwiederherstellung nutzen zu können. Das Inaktivieren der Dateisperre kann zur Folge haben, dass mehrere gleichzeitige Zugriffe auf Wiederherstellungsprotokolle erfolgen. Daher ist es wichtig, dass Sie Ihr System zuerst vor Überlastung und Netzpartitionierung schützen. Alternativ dazu können Sie die manuelle Peerwiederherstellung konfigurieren. Damit verhindern Sie parallele Zugriffe, da Sie die Peerwiederherstellung manuell und nur für tatsächlich ausgefallene Server auslösen.
- Systemüberlastung
- Die Systemüberlastung tritt ein, wenn eine Maschine so stark belastet wird, dass die Reaktionszeiten
sehr lang werden und Anforderungen Zeitlimits überschreiten. Es gibt verschiedene potenzielle Ursachen für die Systemüberlastung:
- Die Serverleistung ist zu niedrig, und der Server kann den Workload nicht bewältigen.
- Der Server hat zu einem bestimmten Zeitpunkt überdurchschnittlich viele Anforderungen empfangen.
- Es ist nicht genügend physischer Speicher verfügbar. Folglich ist das System zu sehr mit Paging-Vorgängen beschäftigt, um dem Anwendungsserver die erforderliche CPU-Zeit zur Verfügung zu stellen.
- Netzpartitionierung
- Die Netzpartitionierung tritt ein, wenn ein Netz aufgrund eines Kommunikationsfehlers in zwei kleinere Netze zerfällt, die zueinander keinen Kontakt mehr haben.

Während des normalen Betriebs tauschen zwei Server im Netz Überwachungssignale aus. Bei Systemüberlastung überschreiten Überwachungssignaloperationen das Zeitlimit, und es tritt scheinbar Serverausfall ein. Nach einer Netzpartitionierung befindet sich jeder Server in einem separaten Netz. Da zwischen den Servern keine Überwachungssignale übertragen werden können, entsteht ebenfalls der Eindruck, dass ein Server ausgefallen ist.