WebSphere Enterprise Service Bus, Versión 6.2.0 Sistemas operativos: AIX, HP-UX, i5/OS, Linux, Solaris, Windows


Evaluación del estado del sistema

Lo primero que se debe hacer ante una condición anómala es tomar el pulso a todo el sistema en general y valorar qué parte del sistema sigue siendo operativa y qué parte ha quedado "fuera de servicio" debido a cualquier estímulo externo que haya provocado esta condición.

Formule un conjunto de preguntas predefinidas para valorar el alcance de la parada. En la lista siguiente se proporcionan ejemplos de preguntas predefinidas diseñadas para ayudarle a recopilar la información apropiada:
  1. ¿El sistema sigue trabajando?

    Determine si el sistema sigue siendo operativo. Con frecuencia el sistema sigue siendo operativo, pero a causa de la sobrecarga o del ajuste inapropiado o por ambos motivos, no puede completar las tareas rápidamente y/o intenta realizar tareas que en realidad contienen errores.

    La prueba de cada una de estas preguntas será específica de la naturaleza de la solución desplegada.

  2. ¿Qué soporte especial de manejo de errores incorpora la aplicación?

    Si existe una gran cantidad de reintento automatizado y diferentes lógicas de soporte, la propia aplicación puede generar errores al manifestar el operador TI.

    El equipo de recuperación debe conocer y documentar estas condiciones para futuras referencias.

A continuación se indican algunas cosas que puede hacer para ayudar a valorar el estado del sistema:
  1. Comprobar si el servidor se está ejecutando.

    ¿Ve el ID de proceso u obtiene una respuesta positiva del gestor de despliegue a través de la consola administrativa?

  2. Compruebe si existen bloqueos en las bases de datos o cualquier tipo de tráfico de base de datos no habitual.
    La mayoría de bases de datos tendrán recursos para buscar los bloqueos. En función de la topología de despliegue, pueden existir diferentes bases de datos.
    • Base de datos del motor de mensajería
    • Base de datos del contenedor de procesos empresariales
    • Base de datos común de WebSphere Process Server (datos de sucesos anómalos y relaciones)
  3. Compruebe cuál es el estado del sistema de mensajería.
    Compruebe si existen sucesos o mensajes en las ubicaciones siguientes:
    • Destinos de almacenamiento y retención de Business Process Choreographer
    • Número de sucesos anómalos
    • Número de mensajes en los destinos del módulo de soluciones
  4. Compruebe si la base de datos funciona.

    ¿Puede realizar alguna operación sencilla de SELECT, en datos no bloqueados en una cantidad razonable de tiempo?

  5. Compruebe si existen errores en las anotaciones cronológicas de la base de datos.

Si la base de datos no funciona correctamente, la recuperación de ésta (para poder, como mínimo, liberar los bloqueos y efectuar selecciones sencillas) es vital para la recuperación del sistema.

Si el sistema de mensajería no funciona correctamente, la recuperación del subsistema de mensajería para poder, como mínimo, visualizarlo y gestionarlo, es vital para la recuperación del sistema.

Nota: Este tipo de enfoque no siempre es concluyente. Sin embargo, las posibilidades de una recuperación satisfactoria varían en función de estas actividades básicas.

A partir de estos procedimientos básicos y de estas actividades de comprobación, ahora debemos empezar a buscar situaciones específicas. Se describirán los patrones y se proporcionarán detalles y perspectivas sobre lo que sucede.

Tenga en cuenta que este análisis de la situación es una actividad de sólo lectura. Aunque proporciona información vital a partir de la cual se determinan las acciones de recuperación apropiadas, no debe cambiar el estado del sistema que se revisa. Es imposible predecir y proporcionar acciones prescriptivas para todas las causas posibles de una parada del sistema. Por ejemplo, considere el árbol de decisión siguiente:

Diagrama que muestra el árbol de decisión para la recuperación.

Pueden investigarse muchas categorías en caso de que se produzca una parada no planificada. Estas categorías tendrán subcategorías, etc. La definición de acciones prescriptivas para cada nodo y el nodo posterior dependerá de los resultados de cada investigación. Como este tipo de relación es difícil de trasladar en forma de documento, se recomienda la utilización de una herramienta de soporte como IBM® Guided Activity Assist que le orientará de forma interactiva a través del proceso de investigación y de toma de decisiones. A medida que se progresa desde la parte superior hasta cada nodo hijo, es importante realizar el nivel apropiado de análisis de la situación.


concept Tema de concepto

Condiciones de uso | Comentarios


Icono de indicación de la hora Última actualización: 05 julio 2010


http://publib.boulder.ibm.com/infocenter/dmndhelp/v6r2mx/topic//com.ibm.websphere.wesb620.doc/doc/cpln_assess_sys_state.html
Copyright IBM Corporation 2005, 2010. Reservados todos los derechos.
Este centro de información está basado en tecnología Eclipse (http://www.eclipse.org).