WebSphere Enterprise Service Bus, Version 6.2.0 Betriebssysteme: AIX, HP-UX, i5/OS, Linux, Solaris, Windows


Systemstatus bewerten

Die erste Maßnahme, die bei einer abnormalen Beendigung ergriffen werden sollte, besteht darin, sozusagen den Puls des Gesamtsystems zu messen und ein Gefühl dafür zu gewinnen, in welchem Maß das System tatsächlich funktionsfähig ist und welcher Anteil des Systems durch bestimmte externe Faktoren, die diesen Zustand verursacht haben, 'außer Betrieb' ist.

Sprechen Sie eine vordefinierte Gruppe von Fragen an, um das Ausmaß des Ausfalls zu bewerten. Die folgende Liste liefert Beispiele für vordefinierte Fragen, die Sie beim Zusammenstellen der situationsgerechten Informationen unterstützen sollen:
  1. Führt dieses System noch Arbeit durch?

    Stellen Sie fest, ob das System noch betriebsbereit (aktiv) ist. Sehr häufig ist ein System noch betriebsbereit, führt aber als Folge von Überlastung und/oder ungeeigneter Optimierung Tasks nicht rasch aus und/oder versucht, Arbeit durchzuführen, die tatsächlich fehlschlägt.

    Der alles entscheidende Test für jede dieser Fragen gilt dabei jeweils konkret für die Spezifik der implementierten Lösung.

  2. Welche besondere Unterstützung zur Fehlerbehandlung ist in die Anwendung integriert?

    Wenn eine große Menge an Logik für automatisierte Wiederholungen und diverse Unterstützung vorhanden ist, könnte die Anwendung selbst einige Fehler abschirmen, sodass diese sich gegenüber dem IT-Operator nicht manifestieren.

    Diese Bedingungen müssen bekannt sein und vom Wiederherstellungsteam zu Referenzzwecken dokumentiert werden.

Sie selbst können bei der Bewertung des Systemstatus unter anderem wie folgt unterstützend mitwirken:
  1. Prüfen Sie, ob der Server zumindest ausgeführt wird.

    Können Sie die Prozess-ID sehen oder erhalten Sie über die Administrationskonsole eine positive Rückmeldung vom Deployment Manager?

  2. Prüfen Sie, ob Sperren in der oder den Datenbanken vorhanden sind oder ungewöhnlicher Datenverkehr vorherrscht.
    Die meisten Datenbanken sind mit Funktionen ausgestattet, die das Anzeigen von Sperren ermöglichen. Abhängig von der Implementierungstopologie können auch mehrere Datenbanken vorhanden sein.
    • Datenbank der Messaging-Steuerkomponente
    • Business Process Container-Datenbank
    • WebSphere Process Server Common-Datenbank (fehlgeschlagene Ereignisse und Beziehungsdaten)
  3. Überprüfen Sie den Status des Messaging-Systems.
    Prüfen Sie an den folgenden Orten, ob Ereignisse oder Nachrichten vorhanden sind:
    • Halte- und Sicherungsziele von Business Process Choreographer
    • Anzahl fehlgeschlagener Ereignisse
    • Anzahl von Nachrichten an den Zielen des Lösungsmoduls
  4. Überprüfen Sie, ob die Datenbank funktioniert.

    Können Sie eine einfache Operation des Typs SELECT für entsperrte Daten innerhalb eines angemessenen Zeitraums ausführen?

  5. Prüfen Sie, ob das Datenbankprotokoll Fehler enthält.

Falls die Datenbank nicht ordnungsgemäß funktioniert, ist eine Wiederherstellung der Datenbank (damit diese zumindest Sperren aufheben und einfache Auswahloperationen durchführen kann) unerlässlich für die Systemwiederherstellung.

Falls das Messaging-System nicht ordnungsgemäß funktioniert, ist eine Wiederherstellung des Messaging-Subsystems, sodass dieses zumindest angezeigt und verwaltet werden kann, ebenfalls unerlässlich für die Systemwiederherstellung.

Anmerkung: Ein 'Bottom-up'-Ansatz ist nicht immer aussagekräftig. Die Wahrscheinlichkeit für eine erfolgreiche Wiederherstellung variiert jedoch in Abhängigkeit von diesen Basisaktivitäten.

Ausgehend von diesen allgemeinen Basisprozeduren und grundlegenden Aktivitäten, zu denen auch die Überwachung des ordnungsgemäßen Betriebs zählt, sollen nun einige spezifische Situationen genauer untersucht werden. Es werden Muster beschrieben, es werden Spezifikationen angegeben und Sie erhalten Einblicke in die Vorgänge, die unter der Oberfläche ablaufen.

Beachten Sie, dass es sich bei dieser Situationsanalyse um einen Vorgang handelt, der keine anderen Aktivitäten als Lesen einbezieht. Zwar liefert sie unerlässliche Informationen, auf deren Grundlage die geeigneten Wiederherstellungsaktionen ermittelt werden können, aber sie dürfte keine Änderungen am Status des Systems, für das die Überprüfung ausgeführt wird, herbeiführen. Eine Vorhersage und Bereitstellung von verbindlichen Aktionen für alle möglichen Ursachen für einen Systemausfall ist nicht möglich. Prüfen Sie zum Beispiel die folgende Entscheidungsstruktur:

Diagramm mit einer Darstellung der Entscheidungsstruktur für die Wiederherstellung

Im Falle einer ungeplanten Betriebsunterbrechung müssen breit gefächerte Kategorien untersucht werden. Diese breit gefächerten Kategorien sind ihrerseits wieder in Unterkategorien unterteilt usw. Die Definition von verbindlichen Aktionen für jeden Knoten und die ihm nachfolgenden Knoten hängen jeweils von den Ergebnissen einer jeden Untersuchung ab. Da diese Art von Beziehung nur unzureichend in Dokumentformat vermittelt werden kann, wird die Verwendung eines Unterstützungstools wie zum Beispiel IBM® Guided Activity Assist empfohlen, das Sie schrittweise und interaktiv durch den Untersuchungs- und Entscheidungsfindungsprozess führt. Während Sie sich von der höchsten Ebene zu jedem untergeordneten Knoten vorwärts bewegen, ist es wichtig, dass jeweils die entsprechende Ebene der Situationsanalyse ausgeführt wird.


concept Konzeptabschnitt

Nutzungsbedingungen | Feedback


Zeitmarkensymbol Letzte Aktualisierung: 05 Juli 2010


http://publib.boulder.ibm.com/infocenter/dmndhelp/v6r2mx/topic//com.ibm.websphere.wesb620.doc/doc/cpln_assess_sys_state.html
Copyright IBM Corporation 2005, 2010. Alle Rechte vorbehalten.
Dieses Information Center basiert auf Eclipse-Technologie (http://www.eclipse.org).