Le paramètre d'intervalle du signal de présence permet de configurer le laps de temps séparant deux vérifications par le système
des serveurs en panne. L'option -heartbeat est un paramètre de la commande
startOGserver, qui s'applique uniquement aux serveurs de catalogue.
Pourquoi et quand exécuter cette tâche
La configuration des basculements varie en fonction du type
d'environnement que vous utilisez. Si vous utilisez un environnement autonome,
vous pouvez configurer les basculements à l'aide de la ligne de commande. Si
vous utilisez un environnement
WebSphere Application Server
Network Deployment, vous devez les configurer à partir de la console
d'administration de
WebSphere Application Server
Network Deployment.
Procédure
- Configurez les basculements pour les environnements autonomes.
Vous pouvez configurer les intervalles des pulsations sur la ligne de commande à l'aide du paramètre -heartbeat dans le fichier de script startOgServer. Affectez
à ce paramètre l'une des valeurs suivantes :
Tableau 1. Intervalles de signal de présenceValeur |
Action |
Description |
0 |
Standard (par défaut) |
Les basculements sont généralement détectés dans les 30 secondes. |
-1 |
Elevé |
Les basculements sont généralement détectés dans les 5 secondes. |
1 |
Souple |
Les basculements sont généralement détectés dans les 180 secondes. |
Un intervalle élevé
entre les signaux de présence peut être utile si les processus et le réseau
sont stables. Si le réseau ou les processus ne sont pas configurés de manière
optimale, il peut manquer des signaux de présence, ce qui peut fausser la
détection des incidents.
- Configurez les basculements pour les environnements WebSphere
Application Server.
Vous pouvez configurer WebSphere Application Server
Network Deployment Version
6.0.2 ou ultérieure pour permettre des basculements très rapides de WebSphere eXtreme Scale. La durée par défaut de pour les incidents matériels est d'environ 200 secondes. Un incident matériel est un ordinateur physique, une panne du serveur, déconnexion de câble réseau ou une erreur du système d'exploitation.
Les incidents dus aux pannes de processus ou à des échecs logiciels sont
généralement basculés en moins d'une seconde. La détection des
incidents logiciels est effectuée lorsque les sockets réseau du processus
inactif sont fermés automatiquement par le système d'exploitation du serveur
qui héberge le processus.
Configuration des signaux de présence du groupe central
Si WebSphere eXtreme Scale est exécuté dans un
processus WebSphere
Application Server, il
hérite des caractéristiques de reprise en ligne des paramètres du groupe
central du serveur d'applications. Les sections suivantes décrivent
comment configurer les paramètres des signaux de présence du groupe central
pour différentes versions de WebSphere Application Server Network Deployment :
- Mise à jour des paramètres des groupes centraux de WebSphere Application Server
Network Deployment Version 6.x et 7.x :
Spécifiez
l'intervalle des signaux de présence en secondes sur les versions 6.0 à 6.1.0.12 de WebSphere
Application Server ou en millisecondes à partir de la version 6.1.0.13. Vous
devez également spécifier le nombre de signaux de présence manqués. Cette
valeur indique le nombre maximal de signaux de présence manquants avant
qu'une machine virtuelle Java (JVM) ne soit considérée
comme défectueuse.
Le délai de détection des incidents matériels est approximativement égal au
produit de l'intervalle des signaux de présence par le nombre de signaux de
présence manqués.
Ces propriétés sont spécifiées à l'aide des
propriétés personnalisées sur le groupe central à l'aide de la console
d'administration de WebSphere. Pour des informations de configuration
détaillées, voir la rubrique
Propriétés personnalisées de groupe central.
Ces propriétés doivent être spécifiées pour tous les groupes centraux
utilisés par l'application :
- L'intervalle des pulsations est spécifié à l'aide de la propriété personnalisée IBM_CS_FD_PERIOD_SEC pour les secondes ou de la propriété personnalisée IBM_CS_FD_PERIOD_MILLIS pour les millisecondes (nécessite la version 6.1.0.13 ou une version ultérieure).
- Le nombre de signaux de présence manqués est spécifié à l'aide de la
propriété personnalisée IBM_CS_FD_CONSECUTIVE_MISSED.
La valeur par défaut de la propriété
IBM_CS_FD_PERIOD_SEC est de 20 et celle de la propriété
IBM_CS_FD_CONSECUTIVE_MISSED, de 10. Si la propriété IBM_CS_FD_PERIOD_MILLIS est
spécifiée, elle remplace les propriétés personnalisées IBM_CS_FD_PERIOD_SEC
définies. Les valeurs de ces propriétés correspondent à des entiers.
Utilisez
les paramètres suivants pour spécifier un délai de détection des incidents de
1500 ms pour les serveurs
WebSphere Application Server
Network Deployment Version
6.x :
- Spécifiez IBM_CS_FD_PERIOD_MILLIS = 750 (WebSphere Application Server
Network Deployment V6.1.0.13 et versions ultérieures)
- Spécifiez IBM_CS_FD_CONSECUTIVE_MISSED = 2
Mise à jour des paramètres des groupes centraux de WebSphere Application Server
Network Deployment Version
7.0
WebSphere Application Server
Network Deployment Version
7.0 fournit deux paramètres de groupe central qui peuvent être ajustés pour
augmenter ou réduire le délai de détection des incidents :
- Période de transmission du signal de présence. La valeur par défaut est de 30000
millisecondes.
- Période d'expiration du signal de présence. La valeur par défaut est de 180000
millisecondes.
Pour plus de détails sur la manière de modifier
ces paramètres, voir la rubrique relative à la WebSphere Application Server
Network Deployment reconnaissance et de détection des incidents dans le centre de documentation.
Utilisez les
paramètres suivants pour spécifier un délai de détection des incidents de 1500
ms pour les serveurs WebSphere Application Server
Network Deployment Version 7 :
- Spécifiez une période de transmission du signal de présence de 750
millisecondes.
- Spécifiez une période d'expiration du signal de présence de 1500
millisecondes.
Que faire ensuite
Lorsque vous modifiez ces paramètres pour réduire les délais de
basculement, certains points d'optimisation du système sont à
prendre en compte. Tout d'abord,
Java n'est pas un environnement en temps réel.
Des unités d'exécution peuvent être retardées si la JVM connaît des délais
de récupération de place importants. Les unités d'exécution risquent également
d'être retardées si la charge de la machine qui héberge la JVM est considérable
(à cause de la JVM
elle-même ou d'autres processus exécutés sur cette machine). Si les unités d'exécution sont
retardées, les signaux de présence risquent de ne pas être envoyés à temps. Au
pire, ils risquent d'être retardés du délai requis pour la reprise en ligne. Si
des unités d'exécution sont retardées, des incidents sont détectés à tort. Le
système doit être optimisé et dimensionné de sorte à éviter la détection de
faux incidents en production.
Il est recommandé pour cela de tester la charge de manière adéquate.
Remarque : La version
actuelle d'eXtreme Scale prend en charge WebSphere Real
Time.