Sugerencias para la resolución de problemas en un entorno de alta disponibilidad
Revise los temas siguientes si encuentra un problema en el entorno de alta disponibilidad.
![[AIX Solaris HP-UX Linux Windows]](../images/dist.gif)
![[z/OS]](../images/ngzos.gif)
El mensaje HMGR0218I no se visualiza después del inicio de la JVM (Java Virtual Machine)
En un entorno de alta disponibilidad configurado correctamente, High Availability Manager puede reevaluar el entorno que está gestionando y aceptar nuevos componentes cuando se añaden al entorno. Por ejemplo, cuando se añada una máquina virtual Java™ (JVM) a la infraestructura, se inicia un proceso de descubrimiento. Durante el arranque, la JVM intenta ponerse en contacto con el resto de miembros del grupo principal. Cuando encuentra otra JVM en ejecución, inicia un proceso de unión con esa JVM que determina si la JVM puede unirse o no al grupo principal. Si la nueva JVM se acepta como miembro del grupo principal, todas las JVM, incluida la nueva, anotan el mensaje HMGR0218I. Este mensaje también aparece en la consola administrativa.
El mensaje HMGR0218I indica el número de servidores de aplicaciones del grupo principal que están en línea actualmente. Si este mensaje no aparece después de que se inicie una JVM, se ha producido un problema de configuración o un problema de comunicación. Para corregir esta situación, verifique que el servidor de aplicaciones se esté ejecutando en una configuración actual mediante el gestor de despliegue para indicar al agente de nodo que debe sincronizarse o utilizar el mandato syncNode para realizar manualmente la sincronización. Si la JVM aún no puede unirse al grupo principal, existe un problema de configuración de red.
![[IBM i]](../images/iseries.gif)
El mensaje HMGR0218I no se visualiza después del inicio del servidor
En un entorno de alta disponibilidad configurado correctamente, High Availability Manager puede reevaluar el entorno que está gestionando y aceptar nuevos componentes cuando se añaden al entorno. Por ejemplo, cuando se añada una máquina virtual Java (servidor) a la infraestructura, se inicia un proceso de descubrimiento. Durante el arranque, el servidor intenta ponerse en contacto con el resto de miembros del grupo principal. Cuando encuentra otro servidor en ejecución, inicia un proceso de unión con ese servidor que determina si el servidor puede unirse o no al grupo principal. Si se acepta el nuevo servidor como miembro del grupo principal, todos los servidores, incluido el nuevo, registran cronológicamente el mensaje HMGR0218I. Este mensaje también aparece en la consola administrativa.
El mensaje HMGR0218I indica el número de servidores de aplicaciones del grupo principal que están en línea actualmente. Si este mensaje no aparece después de que se inicie un servidor, se ha producido un problema de configuración o un problema de comunicación. Para corregir esta situación, verifique que el servidor de aplicaciones se esté ejecutando en una configuración actual mediante el gestor de despliegue para indicar al agente de nodo que debe sincronizarse o utilizar el mandato syncNode para realizar manualmente la sincronización. Si el servidor continúa sin poderse unir al grupo principal, existe un problema de configuración de red.
Aparece el mensaje HMGR0123I en el archivo de registro cronológico del sistema
Es posible que aparezca el mensaje HMGR0123I en el archivo de registro cronológico del sistema al mismo tiempo que cambia el coordinador activo. Por ejemplo, es posible que este mensaje se emita cuando un miembro del grupo principal se reinicia y pasa a ser el coordinador activo.
Esté mensaje informativo generalmente no indica un problema grave. Aunque este mensaje aparezca en el archivo de registro cronológico del sistema, el nuevo coordinador activo recibe el estado del grupo actualizado. Si desea minimizar las apariciones del mensaje, debe seleccionar un miembro del grupo principal que no se reinicie frecuentemente como el coordinador preferido del grupo principal.
Mensajes de falta de recursos en el archivo de registro cronológico del sistema
Aparecen los mensajes de error Se ha detectado una falta de recursos en la CPU en el archivo de registro cronológico del sistema siempre que no hay suficiente memoria física disponible para permitir que las hebras de High Availability Manager tengan tiempos de ejecución coherentes. Cuando la CPU invierte la mayoría del tiempo intentando cargar procesos intercambiados mientras se procesa el trabajo entrante, pueden faltar recursos de hebra. High Availability Manager detecta esta condición y registra estos mensajes de error informándole de que las hebras no están recibiendo el tiempo de ejecución necesario.
Para conseguir un buen rendimiento y no recibir estos mensajes de error, se recomienda asignar al menos 512 MB de RAM para cada proceso Java que se ejecute en una única máquina.
Uso elevado de la CPU en una configuración de células grande cuando está habilitada la seguridad
En determinadas configuraciones y estados, la cantidad de tiempo dedicado a la detección pasa a ser importante.- Si se define un gran número de procesos dentro de un grupo principal, se debe establecer un número proporcionalmente grande de conexiones para dar soporte a estos procesos.
- Si se define un gran número de procesos inactivos dentro de un grupo principal, se intenta un número de conexiones proporcionalmente elevado durante el intervalo de detección.
- Si se habilita la seguridad administrativa, las conexiones DCS son seguras y el impacto de abrir una conexión aumenta enormemente.
Utilice la página Descubrimiento y detección de fallos de la consola administrativa para aumentar el intervalo de tiempo que esperará el protocolo de descubrimiento para calcular el conjunto de miembros de grupo principal desconectados, e intentar abrir conexiones con dichos miembros. El aumento del intervalo de tiempo entre períodos de descubrimiento consecutivos hace que disminuya el intervalo de tiempo CPU que se emplea en el descubrimiento. En el tema Configuración del protocolo de descubrimiento para un grupo principal podrá obtener más información.
Anomalías transitorias de pulsaciones de alta disponibilidad en condiciones de mucha carga
En condiciones de mucha carga de trabajo, pueden producirse condiciones de anomalías transitorias entre socios de duplicación en una configuración de alta disponibilidad, aunque parezca que ambos socios de duplicación se estén ejecutando correctamente.
En los sistemas operativos Linux, este problema puede deberse a problemas de conexión TCP
en el canal de duplicación entre los socios de duplicación. Estos problemas de conexión
se producen porque el almacenamiento intermedio TCP no es suficientemente grande para
soportar el alto volumen de duplicación de datos que se está intercambiando. Para evitar
estas falsas condiciones de anomalía de pulsaciones, se recomienda ajustar los tamaños de
almacenamiento intermedio TCP, tal como se recomienda en la sección de ajuste de kernel
de Linux del tema que describe cómo ajustar servlets SIP para Linux.