WebSphere Enterprise Service Bus, Version 6.2.0 Systèmes d'exploitation: AIX, HP-UX, i5/OS, Linux, Solaris, Windows


Evaluation de l'état du système

La première action à entreprendre face à une situation anormale est de prendre le pouls de l'ensemble du système en vue d'évaluer son niveau de service et de déterminer dans quelle mesure l'événement externe ayant entraîné cette situation entrave son fonctionnement.

Vous devez traiter un ensemble prédéfini de questions pour évaluer l'étendue du problème. La liste suivante présente des exemples de questions visant à vous permettre de regrouper les informations nécessaires :
  1. Ce système fonctionne-t-il toujours ?

    Déterminez si le système est toujours opérationnel. Parfois le système est toujours opérationnel, mais en raison d'une surcharge ou d'une optimisation inadaptée, voire les deux, le système effectue les tâches lentement et/ou tente d'effectuer des tâches en cours d'échec.

    Le test pour chacune de ces questions sera propre à la nature de la solution déployée.

  2. Quel support de traitement d'erreurs particulier l'application intègre-t-elle ?

    S'il y a beaucoup de tentatives automatisées et diverses logiques de support, l'application elle-même peut empêcher que l'opérateur soit averti de certaines erreurs.

    Ces conditions doivent être connues et documentées afin de fournir des références à l'équipe chargée de la reprise.

Pour évaluer le système, vous pouvez :
  1. Vérifier au moins si le serveur est en marche.

    Voyez-vous le PID ou avez-vous un retour positif du gestionnaire de déploiement via la console d'administration ?

  2. Vérifier s'il y a des verrous dans la(es) base(s) de données ou un trafic inhabituel de la base de données.
    La plupart des bases de données ont des fonctions de recherche des verrous. En fonction de la topologie du déploiement, il peut y avoir plusieurs bases de données.
    • Base de données de moteur de messagerie
    • Base de données de conteneur de processus métier
    • Base de données commune WebSphere Process Server (données Evénements ayant échoué et Relations)
  3. Vérifier le statut du système de messagerie.
    Vérifiez les événements ou les messages dans les emplacements suivants :
    • Destinations de mise en attente et de conservation de Business Process Choreographer
    • Nombre d'événements ayant échoué
    • Nombre de messages sur les destinations de modules des solutions
  4. Vérifier si la base de données fonctionne.

    Pouvez-vous effectuer une simple sélection, sur les données déverrouillées, dans un lapse de temps raisonnable ?

  5. Vérifier s'il y a des erreurs dans le journal de base de données.

Si la base de données ne fonctionne pas correctement, il est vital de la récupérer (afin de débloquer au moins les verrous et d'effectuer de simples sélections) pour la reprise du système.

Si le système de messagerie ne fonctionne pas correctement, la reprise du sous-système de messagerie, pour au moins l'afficher et pouvoir le gérer, est également vitale pour la reprise du système.

Remarque : Une approche de type ‘remontée' n'est pas toujours concluante. Cependant, les chances de reprise du système varient en fonction de ces activités de base.

A partir de ces procédures de base et de ces types d'activité de vérification de la santé du système, il faut ensuite commencer à s'intéresser à certaines situations particulières. Des modèles seront décrits, des caractéristiques seront fournies ainsi qu'une analyse de ce qui se passe.

Cette analyse situationnelle est une activité en lecture seule. Elle fournit des informations vitales permettant de déterminer les corrections nécessaires et ne doit pas modifier l'état du système en cours de révision. Il est impossible de prévoir et de fournir les actions nécessaires pour toutes les causes possibles d'une indisponibilité du système. Soit l'arbre de décisions suivant :

Diagramme représentant l'arbre de décisions concernant une reprise.

Il existe un grand nombre de catégories à examiner dans le cas d'une indisponibilité non planifiée. Ces catégories ont par ailleurs des sous-catégories et ainsi de suite. La définition des actions pour chaque noeud et le noeud suivant dépend des résultats de chaque examen. Ce type de relation étant difficile à transmettre dans un format document, il est recommandé d'utiliser un outil de support tel que IBM® Guided Activity Assist pour examiner le problème et prendre des décisions en conséquence en mode interactif. La progression s'effectuant du haut vers chaque noeud enfant, il est important d'utiliser le niveau d'analyse situationnelle approprié.


concept Rubrique concept

Conditions d'utilisation | Commentaires en retour


Icône d'horodatage Dernière mise à jour: 07 juillet 2010


http://publib.boulder.ibm.com/infocenter/dmndhelp/v6r2mx/topic//com.ibm.websphere.wesb620.doc/doc/cpln_assess_sys_state.html
Copyright IBM Corporation 2005, 2010. All Rights Reserved.
Ce centre d'information est mis en service par la technologie Eclipse (http://www.eclipse.org).