Résolution des incidents

Ce chapitre permet la détection et la résolution des incidents associés à Load Balancer.

Collecte des informations de résolution des incidents

Utilisez les informations de cette section pour rassembler les données nécessaires au service d'assistance IBM. Les informations sont classées sous les rubriques suivantes :

Informations générales (obligatoires)

Le composant Dispatcher (et lui seul), dispose d'un outil d'identification des incidents qui collecte automatiquement les données propres au système d'exploitation et les fichiers de configuration de composants donnés. Pour lancer cet outil, entrez lbpd à partir du répertoire approprié, c'est-à-dire :

Cet outil d'identification des incidents regroupe les données collectées dans des fichiers comme suit :

Avant d'appeler le service d'assistance IBM, regroupez les informations ci-après.

Incidents liés à la haute disponibilité

En cas d'incident dans un environnement de haute disponibilité, regroupez les informations requises ci-après.

Incidents liés aux conseillers

En cas d'incident lié aux conseillers (par exemple lorsque des conseillers déclarent par erreur des serveurs inactifs), regroupez les informations requises ci-après.

Remarque :
Lors de la création d'un conseiller personnalisé, il est recommandé d'utiliser le journal ADVLOG(niveaujournal,message) pour vérifier que le conseiller fonctionne correctement.

L'appel ADVLOG génère des instructions dans le fichier journal des conseillers lorsque le niveau de consignation est inférieur à celui associé aux conseillers. Si le niveau de consignation est 0, l'instruction est toujours générée. Vous ne pouvez pas utiliser ADVLOG à partir du constructeur. Le fichier journal n'est créé qu'une fois que l'exécution du constructeur du conseiller personnalisé est terminée car le nom du fichier journal dépend des informations définies dans le constructeur.

Il existe cependant une autre manière de déboguer votre conseiller personnalisé qui permet d'éviter cette restriction. Vous pouvez utiliser des instructions System.out.println(message) pour imprimer les messages à l'écran. Editez le script dsserver et remplacez javaw par java pour que les instructions d'impression apparaissent dans la fenêtre. La fenêtre utilisée pour démarrer dsserver ne doit pas être fermée, pour que les impressions soient affichées. Si vous utilisez une plateforme Windows, vous devez arrêter le service Dispatcher, puis le démarrer manuellement à partir d'une fenêtre pour apercevoir les messages.

Pour plus d'informations sur ADVLOG, reportez-vous au document Programming Guide for Edge Components.

Incident liés au routage par contenu (CBR)

En cas d'incident lié au routage par contenu (CBR), regroupez les informations requises ci-après.

Impossibilité d'accéder au cluster

Si vous n'arrivez pas à accéder au cluster, il est possible que l'une des machines Load Balancer ou les deux ont attribué un alias au cluster. Pour déterminer laquelle détient le cluster, procédez comme suit :

  1. Sur le même sous-réseau et non sur une machine Load Balancer ou serveur :
    ping
    cluster
    arp -a
    Si vous utilisez des méthodes d'acheminement NAT ou CBR de Dispatcher, lancez également une commande ping vers l'adresse de retour.
  2. Observez le résultat de arp et faites correspondre l'adresse MAC (adresse hexadécimale en 16 chiffres) avec l'un des résultats de netstat -ni pour déterminer à quelle machine appartient physiquement le cluster.
  3. Utilisez les commandes suivantes pour interpréter le résultat des deux machines et déterminer si elles détiennent toutes deux l'adresse du cluster.

Si vous n'obtenez pas de réponse à la commande ping et que vous n'utilisez pas l'ULB, il est possible qu'aucune des machine n'ait attribué d'alias à l'adresse IP du cluster sur son interface, par exemple en0, tr0 et ainsi de suite.

Echec de toutes les tentatives de résolution des incidents

Si vous n'arrivez pas à résoudre des incidents de routage et que toute vos tentatives ont échoué, émettez la commande suivante pour lancer une trace du trafic réseau :

Vous pouvez également augmenter les niveaux de différents journaux (par exemple, journal du gestionnaire, journal du conseiller, etc.) et analyser les informations qu'ils contiennent.

Mises à niveau

Pour identifier un incident déjà résolu dans un correctif Service Release, recherchez les mises à niveau disponibles. Pour obtenir la liste des défauts Edge Components corrigés, reportez-vous à la page Web d'assistance de WebSphere Application Server : http://www.ibm.com/software/webservers/appserv/was/support/. A partir de cette page, cliquez sur le lien permettant d'accéder au site de téléchargement des correctifs.

Code Java

La version correcte du code Java est installée lors de l'installation de Load Balancer.

Pour accéder aux liens des pages Web du support et de la bibliothèque, voir Informations connexes. La page de support Web contient un lien à l'aide sous la forme de notes techniques.

Tableaux de résolution des incidents

Pour les opérations répertoriées, reportez-vous au tableau indiqué.

Tableau 12. Tableau de résolution des incidents de Dispatcher
Symptôme Cause possible Voir...
Dispatcher ne fonctionne pas correctement Conflit de numéros de port Vérification des numéros de port Dispatcher
Le serveur configuré ne répond pas aux requêtes d'équilibrage de charge Conflit d'adresses ou adresse erronée Incident : Le répartiteur et le serveur ne répondent pas
Absence de prise en charge des connexions des machines client ou dépassement de délai des connexions
  • Mauvaise configuration de réacheminement
  • NIC sans alias avec l'adresse de cluster
  • Le serveur n'a pas d'unité de bouclage ayant un alias pour l'adresse de cluster
  • Le chemin supplémentaire n'est pas supprimé
  • Le port n'est pas défini pour chaque cluster
Incident : Les requêtes Dispatcher ne sont pas équilibrées
Les machines client ne sont pas prises en charge ou le délai imparti à ces connexions est dépassé La fonction haute disponibilité est inopérante Incident : La fonction haute disponibilité de Dispatcher est inopérante
Impossible d'ajouter un signal de présence (plateforme Windows) L'adresse source n'est pas configurée sur un adaptateur Incident : Impossible d'ajouter un signal de présence (plateforme Windows)
Les conseillers ne fonctionnent pas correctement en réseau étendu Les conseillers ne fonctionnent pas sur les machines distantes Incident : Les conseillers ne fonctionnent pas correctement
Sur un serveur dorsal exécutant Windows Server 2008, memload.exe s'interrompt Le registre Windows Server 2008 peut ne pas être rempli avec les clés de performance que ces outils requièrent. Cette interruption d'application doit être signalée à partir de l'application cpuload. Problème : Sur un serveur dorsal Windows Server 2008, memload.exe s'interrompt
Dispatcher, Microsoft IIS et SSL ne fonctionnent pas ou risquent de s'arrêter Impossible d'envoyer des données codées via les protocoles Incident : Dispatcher, Microsoft IIS et SSL ne fonctionnent pas (plateformeWindows)
Connexion à une machine distante refusée Une ancienne version des clés est encore utilisée Incident : Connexion du répartiteur à une machine éloignée
La commande dscontrol ou lbadmin n'a pas abouti, le message ‘Le serveur ne répond pas' ou ‘Impossible d'accéder au serveur RMI' s'affiche
  1. Echec des commandes en raison d'une pile mise sur "sock". Ou les commandes n'ont pas abouti car dsserver n'a pas été lancé.
  2. La définition des ports RMI est incorrecte.
  3. Un hôte local est incorrect dans le fichier hôte
Incident : La commande dscontrol ou lbadmin n'a pas abouti
“Cannot Find the File..." s'affiche lors de l'utilisation de Netscape comme navigateur par défaut pour afficher l'aide en ligne (plateforme Windows) Paramétrage incorrect pour l'association de fichier HTML Incident : Message d'erreur “Impossible de trouver le fichier..." Message d'erreur lors de la tentative d'afficher l'aide en ligne (plateforme Windows)
L'interface graphique ne démarre pas correctement Espace de pagination insuffisant Incident : L'interface graphique ne démarre pas correctement
Erreur lors de l'exécution de Dispatcher lorsque Caching Proxy est installé Dépendance de fichiers Caching Proxy Incident : Erreur lors de l'exécution de Dispatcher lorsque Caching Proxy est installé
L'interface utilisateur graphique ne s'affiche pas correctement. La résolution est incorrecte. Incident : L'interface graphique ne s'affiche pas correctement.
Les panneaux d'aide apparaissent parfois sous d'autres fenêtres Restriction Java Incident : Sous Windows, les fenêtre d'aide disparaissent parfois sous d'autres fenêtres ouvertes
Load Balancer ne peut pas traiter et transmettre de cadre Une adresse MAC unique est nécessaire pour chaque carte NIC Incident: Load Balancer ne peut pas traiter et transmettre un cadre
Un écran bleu apparaît Aucune carte réseau n'est installée et configurée Incident : Un écran bleu s'affiche lors du démarrage de l'exécuteur Load Balancer
La fonction Path MTU Discovery permet d'éviter le trafic retour Le cluster est associé à un alias sur l'unité de bouclage Incident : La fonction Path MTU Discovery permet d'éviter le trafic retour avec Load Balancer
La fonction haute disponibilité de Load Balancer en mode réseau étendu est inopérante La machine Dispatcher éloignée doit être définie en tant que serveur d'un cluster sur la machine Dispatcher locale Incident : La fonction haute disponibilité de Load Balancer en mode réseau étendu est inopérante
Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux. La mémoire est insuffisante pour permettre à Java de traiter une modification de l'interface graphique de cette ampleur Incident : Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux
Adresses IP non résolues correctement sur la connexion éloignée Lors de l'utilisation d'un client éloigné sur une implémentation SSL, des noms d'hôtes ou des noms de domaines complets ne sont pas correctement convertis en adresses IP Incident : Adresses IP non résolues correctement sur la connexion éloignée
L'interface coréenne de Load Balancer affiche sous AIX et Linux des polices non souhaitées ou qui se chevauchent Vous devez modifier les polices de caractères par défaut Incident : L'interface coréenne de Load Balancer affiche sous AIX et Linux des polices non souhaitées ou qui se chevauchent
Sous Windows, lorsqu'un alias a été attribué à l'unité de bouclage de MS, le système d'exploitation ne répond pas correctement à l'adresse d'alias lors de l'émission d'une commande telle que hostname Dans la liste des connexions réseau, le nouvel alias ne doit pas se trouver au-dessus de l'adresse locale Incident : Sous Windows, adresse d'alias renvoyée au lieu de l'adresse locale lors de l'émission de commandes telles que hostname
Comportement inattendu de l'interface graphique lors de l'utilisation de Windows avec une carte vidéo Matrox AGP Incident lors de l'utilisation de cartes Matrox AGP en cours d'exécution de l'interface graphique de Load Balancer Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP
Comportement inattendu, tel un arrêt du système, lors de l'exécution de "rmmod ibmlb" sous Linux Incident lors du retrait manuel du noyau du module Load Balancer (ibmlb). Incident : Comportement inattendu lors de l'exécution de "rmmod ibmlb" (systèmes Linux)
Temps de réponse important lors de l'exécution de commandes sur la machine Dispatcher Un temps de réponse important peut être dû à une surcharge de la machine liée à un volume élevé de trafic client Incident : Temps de réponse long lors de l'exécution de commandes sur la machine Dispatcher.
Pour la méthode d'acheminement MAC de Dispatcher, le conseiller SSL ou HTTPS n'enregistrement pas les charges des serveurs Incident lié au fait que l'application serveur SSL n'est pas configurée avec l'adresse IP du cluster Incident : Le conseiller SSL ou HTTPS n'enregistre pas les charges des serveurs (avec l'acheminement MAC)
Déconnexion de l'hôte lors de l'administration Web à distance via Netscape Cette déconnexion se produit lors du redimensionnement de la fenêtre du navigateur Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web
Sur la plateforme Windows, des caractères nationaux Latin-1 endommagés apparaissent sur la ligne de commande Modifiez les propriétés des polices de la fenêtre d'invite de commande Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande
Sur la plateforme HP-UX, le message suivant est généré : java.lang.OutOfMemoryError unable to create new native thread Certaines installations HP-UX autorisent par défaut 64 unités d'exécution par processus. Cela est suffisant. Problème : Sur HP-UX, la mémoire est insuffisante pour Java ou une erreur d'unité d'exécution est générée
Sur la plateforme Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés Le déchargement des tâches n'est pas désactivé ou il doit activer ICMP. Incident : Sous Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés
Sur la plateforme Windows, la résolution de l'adresse IP en nom d'hôte n'est pas possible lorsque plusieurs adresses sont configurées sur un adaptateur L'adresse IP que vous voulez comme nom d'hôte doit d'abord apparaître dans le registre. Incident : Sous Windows, la résolution de l'adresse IP en nom d'hôte n'est pas possible lorsque plusieurs adresses sont configurées sur un adaptateur
Sur la plateforme Windows, les conseillers ne fonctionnent pas dans une configuration en haute disponibilité après une panne réseau Lorsque le système détecte une panne réseau, il efface sa mémoire cache ARP (Address Resolution Protocol) Incident : Sous Windows, les conseillers ne fonctionnent pas dans une configuration en haute disponibilité après une panne réseau
Sur les systèmes Linux, la commande "IP address add" et les alias de bouclage de cluster multiples sont incompatibles Lorsque vous attribuez des alias à plusieurs adresses sur l'unité de bouclage, vous devez utiliser la commande ifconfig et non la commande ip address add Incident : Sous Linux, n'utilisez pas la commande "IP address add" lors de l'affectation d'alias à plusieurs clusters de l'unité de bouclage
Message d'erreur : "Adresse de routeur non spécifiée ou non valide pour la méthode port" lors de la tentative d'ajout d'un serveur Liste de contrôle permettant d'identifier l'incident qui s'est produit lors de l'ajout d'un serveur Incident : Message d'erreur "Adresse de routeur non spécifiée ou non valide pour la méthode port"
Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de session de terminal à partir de laquelle ils ont été lancés Utilisez la commande nohup afin que les processus lancés ne reçoivent pas un signal d'arrêt lorsque vous quittez la session de terminal. Incident : Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de terminal à partir de laquelle ils ont été lancés
Un ralentissement se produit lors du chargement des configurations Load Balancer Ce délai peut provenir des appels DNS effectués pour résoudre et vérifier l'adresse du serveur. Incident : Délai lors du chargement d'une configuration Load Balancer
Sur les systèmes Windows, un message d'erreur s'affiche pour indiquer qu'il existe un conflit d'adresses IP avec un autre système du réseau Si la fonction de haute disponibilité est configurée, il est possible que des adresses de cluster soient définies sur les deux systèmes pendant une courte période et qu'elles génèrent ce message d'erreur. Incident : Sur les systèmes Windows, un message d'erreur lié à un conflit d'adresses IP apparaît à l'écran
Les machines principale et de secours sont toutes deux activées en mode haute disponibilité. Cet incident peut survenir lorsque les scripts go ne sont pas exécutés sur la machine principale ou la machine de secours. Incident : Les machines principale et de secours sont toutes deux activées en mode haute disponibilité
Les demandes client échouent lorsque Dispatcher tente de renvoyer des réponses de grande page Les demandes client générant des réponses de grande page arrivent à expiration si la taille maximale en transmission (MTU) n'est pas définie correctement sur la répartiteur lors de l'utilisation de la méthode de transfert nat ou cbr. Incident : Les demandes client échouent lors de la tentative de renvoi de réponses de grande page
Sur les systèmes Windows, l'erreur "Le serveur ne répond pas" se produit lors de l'exécution de la commande dscontrol ou lbadmin Lorsqu'il existe plusieurs adresses IP sur un système Windows et que le fichier hôte ne spécifie pas l'adresse à associer au nom d'hôte. Incident : Sous Windows, l'erreur "Le serveur ne répond pas" survient lors de l'exécution d'une commande dscontrol ou lbadmin
Les machines Dispatcher à haute disponibilité risquent de ne pas être synchronisées sous Linux pour S/390 avec des périphériques qeth Lors de l'utilisation de la haute disponibilité sur des systèmes Linux S/390 avec le pilote réseau qeth, la synchronisation des machines Dispatcher active et de secours risque d'échouer. Incident : Les machines Dispatcher à haute disponibilité risquent de ne pas être synchronisées sur les systèmes Linux pour S/390 avec des pilotes qeth
Conseils de configuration de la fonction haute disponibilité de Load Balancer Ces conseils visent à réduire les incidents liés à la haute disponibilité tels que :
  • suppression des connexions après la reprise,
  • synchronisation impossible des machines partenaires,
  • demandes dirigées à tort vers la machine partenaire de secours.
Incident : Conseils sur la configuration de la haute disponibilité
Limitations de la configuration de l'acheminement MAC pour Dispatcher avec les plateformes zSeries et S/390 Sous Linux, il existe des limitations lorsque vous utilisez des serveurs zSeries ou S/390 dotés de cartes OSA (Open System Adapter). Des solutions alternatives sont fournies. Incident : Sous Linux, la configuration de Dispatcher est limitée lorsque vous utilisez des serveurs zSeries ou S/390 dotés de cartes OSA (Open System Adapter)
Dans certaines versions Red hat Linux, une fuite de mémoire se produit lors de l'exécution de Load Balancer configuré avec le gestionnaire et les conseillers Les versions IBM Java SDK de JVM et la bibliothèque NPTL (Native POSIX Thread Library) livrée avec certaines distributions de Linux, comme Red Hat Enterprise Linux 3.0, peuvent être à l'origine de la fuite de mémoire. Incident : Sur certaines versions de Linux, des fuites de mémoire se produisent lors de l'exécution de Dispatcher configuré avec le gestionnaire et les conseillers
Sur SUSE Linux Enterprise Server 9, un rapport Dispatcher report indique que les paquets sont acheminés (le nombre de paquets augmente), alors que les paquets n'atteignent jamais les serveur dorsal Le module NAT iptables est chargé. Cette version d'iptables contient une erreur possible, bien que non confirmée, entraînant un comportement étrange lors des interactions avec Dispatcher. Incident : Sur SUSE Linux Enterprise Server 9, Dispatcher réachemine des paquets qui n'atteignent jamais le serveur dorsal
Sur les systèmes Windows des problèmes apparaissent lors de la reprise lorsque la fonction haute disponibilité du composant Dispatcher est utilisée. Si le goScript configurant l'adresse IP de cluster sur la machine active s'exécute avant celui qui annule la configuration de l'adresse IP de cluster sur la machine de secours, des incidents risquent de se produire. Incident : Sous Windows, un message d'erreur lié à un conflit d'adresses IP apparaît à l'écran lors de la reprise de la haute disponibilité
Sur les systèmes Linux, les iptables peuvent interférer avec le routage des paquets. Les iptables Linux peuvent interférer avec l'équilibrage de charge du trafic et doivent être désactivées sur la machine Load Balancer. Incident : Les iptables Linux peuvent interférer avec le routage de paquets
Un message d'avertissement sur un ensemble de fichiers Java s'affiche lors de l'installation de correctifs de service ou lors de l'installation en mode natif, à l'aide des outils de création de packages du système. L'installation du produit comporte plusieurs packages qu'il n'est pas nécessaire d'installer sur la même machine, donc chacun de ces packages installe un ensemble de fichiers Java. En cas d'installation sur la même machine, un message d'avertissement indique que l'ensemble de fichiers Java appartient également à un autre ensemble de fichiers.
Mise à niveau de l'ensemble de fichiers Java fourni avec les installations Load Balancer En cas d'incident au niveau de l'ensemble de fichiers Java, contactez le service d'assistance IBM pour recevoir une mise à niveau de l'ensemble de fichiers Java qui a été fourni avec l'installation Load Balancer. Mise à niveau de l'ensemble de fichiers Java fourni avec l'installation Load Balancer
Les connexions persistantes peuvent être supprimées lors de la reprise de la haute disponibilité sur une plateforme Windows Sur les systèmes d'exploitation Microsoft Windows, les connexions persistantes peuvent être supprimées lors d'une reprise de haute disponibilité. Cet incident se produit uniquement lorsqu'un serveur co-implanté utilise la méthode d'acheminement MAC. Incident : Des connexions persistantes peuvent être supprimées lors de la reprise de la haute disponibilité
Tableau 13. Résolution des incidents liés à CBR
Symptôme Cause possible Voir.
CBR ne fonctionne pas correctement Conflit de numéros de port Vérification des numéros de port CBR
La commande cbrcontrol ou lbadmin n'a pas abouti, le message ‘Le serveur ne répond pas' ou ‘Impossible d'accéder au serveur RMI' s'affiche Echec des commandes en raison d'une pile mise sur "sock". Ou les commandes n'ont pas abouti car cbrserver n'a pas été lancé Incident : La commande cbrcontrol ou lbadmin n'a pas abouti
La charge des demandes n'est pas équilibrée Caching Proxy a été lancé avant l'exécuteur Incident : Les requêtes ne sont pas équilibrées
Sous Solaris, la commande cbrcontrol executor start renvoie le message suivant : ‘Erreur : l'exécuteur n'a pas été lancé message La commande peut échouer lorsqu'une modification des valeurs IPC système par défaut est nécessaire ou que le lien permettant d'accéder à la bibliothèque est incorrect. Incident : Sur les systèmes Solaris, la commande cbrcontrol executor start n'aboutit pas
La règle d'URL ne fonctionne pas Erreur de syntaxe ou de configuration Incident : Erreur de syntaxe ou de configuration
Comportement inattendu de l'interface graphique lors de l'utilisation de systèmes Windows avec une carte vidéo Matrox AGP Incident lors de l'utilisation de cartes Matrox AGP en cours d'exécution de l'interface graphique de Load Balancer Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP
Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux. La mémoire est insuffisante pour permettre à Java de traiter une modification de l'interface graphique de cette ampleur Incident : Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux
Déconnexion de l'hôte lors de l'administration Web à distance via Netscape Cette déconnexion se produit lors du redimensionnement de la fenêtre du navigateur Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web
Sur la plateforme Windows, des caractères nationaux Latin-1 endommagés apparaissent sur la ligne de commande Modifiez les propriétés des polices de la fenêtre d'invite de commande Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande
Sur la plateforme HP-UX, le message suivant est généré : java.lang.OutOfMemoryError unable to create new native thread Certaines installations HP-UX autorisent par défaut 64 unités d'exécution par processus. Cela est suffisant. Incident : Sous HP-UX, la mémoire est insuffisante pour Java et une erreur d'unité d'exécution est générée
Sur la plateforme Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés Le déchargement des tâches n'est pas désactivé ou il doit activer icmp. Incident : Sous Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés
Sur la plateforme Windows, la résolution de l'adresse IP en nom d'hôte n'est pas possible lorsque plusieurs adresses sont configurées sur un adaptateur L'adresse IP que vous voulez comme nom d'hôte doit d'abord apparaître dans le registre. Incident : Sur les systèmes Windows, la résolution de l'adresse IP en nom d'hôte n'est pas possible lorsque plusieurs adresses sont configurées sur un adaptateur
Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de session de terminal à partir de laquelle ils ont été lancés Utilisez la commande nohup afin que les processus lancés ne reçoivent pas un signal d'arrêt lorsque vous quittez la session de terminal. Incident : Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de terminal à partir de laquelle ils ont été lancés
Tableau 14. Tableau de résolution des incidents de Site Selector
Symptôme Cause possible Voir...
Site Selector ne s'exécute pas correctement Conflit de numéros de port Vérification des numéros de port Site Selector
Site Selector n'effectue pas de demandes entrantes permutées de façon circulaire à partir des clients Solaris Les système Solaris exécutent un "démon de mémoire cache de service annuaire" Incident : Site Selector ne permet pas le trafic de façon circulaire à partir des clients Solaris
La commande sscontrol ou lbadmin n'a pas abouti, le message ‘Le serveur ne répond pas' ou ‘Impossible d'accéder au serveur RMI' s'affiche Echec des commandes en raison d'une pile mise sur "sock". Ou les commandes n'ont pas abouti car ssserver n'a pas été lancé. Incident : La commande sscontrol ou lbadmin n'a pas abouti
Echec du démarrage de ssserver sous Windows Les systèmes Windows ne nécessitent pas toujours la présence du nom d'hôte dans le système DNS. Incident : Echec du démarrage de ssserver sous Windows
Machine ayant des chemins en double pour lequel l'équilibrage de charge ne s'effectue pas correctement -- la résolution de noms semble ne pas aboutir Machine Site Selector ayant plusieurs cartes associées au même sous-réseau Incident : Site Selector possède des chemins en double pour lequel l'équilibrage de charge ne s'effectue pas correctement
Comportement inattendu de l'interface graphique lors de l'utilisation de Windows avec une carte vidéo Matrox AGP Incident lors de l'utilisation de cartes Matrox AGP en cours d'exécution de l'interface graphique de Load Balancer Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP
Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux. La mémoire est insuffisante pour permettre à Java de traiter une modification de l'interface graphique de cette ampleur Incident : Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux
Déconnexion de l'hôte lors de l'administration Web à distance via Netscape Cette déconnexion se produit lors du redimensionnement de la fenêtre du navigateur Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web
Sur la plateforme Windows, des caractères nationaux Latin-1 endommagés apparaissent sur la ligne de commande Modifiez les propriétés des polices de la fenêtre d'invite de commande Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande
Sur la plateforme HP-UX, le message suivant est généré : java.lang.OutOfMemoryError unable to create new native thread Certaines installations HP-UX autorisent par défaut 64 unités d'exécution par processus. Cela est suffisant. Incident : Sur HP-UX, l'erreur Java out of memory/thread
Sur la plateforme Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés Le déchargement des tâches n'est pas désactivé ou il doit activer icmp. Incident : Sous Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés
Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de session de terminal à partir de laquelle ils ont été lancés Utilisez la commande nohup afin que les processus lancés ne reçoivent pas un signal d'arrêt lorsque vous quittez la session de terminal. Incident : Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de terminal à partir de laquelle ils ont été lancés
Tableau 15. Tableau de résolution des incidents de Contrôleur pour commutateurs Cisco CSS
Symptôme Cause possible Voir...
échec du lancement de ccoserver Conflit de numéros de port Vérification des numéros de port Cisco CSS Controller
La commande ccocontrol ou lbadmin n'a pas abouti, le message ‘Le serveur ne répond pas' ou ‘Impossible d'accéder au serveur RMI' s'affiche Echec des commandes en raison d'une pile mise sur "sock". Ou les commandes n'aboutissent pas car ccoserver n'a pas été lancé. Incident : La commande ccocontrol ou lbadmin n'a pas abouti
Erreur de réception : Impossible de créer un registre sur le port 13099 Licence du produit expirée Incident : Impossible de créer un registre sur le port 13099
Comportement inattendu de l'interface graphique lors de l'utilisation de Windows avec une carte vidéo Matrox AGP Incident lors de l'utilisation de cartes Matrox AGP en cours d'exécution de l'interface graphique de Load Balancer Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP
Réception d'une erreur de connexion lors de l'ajout d'un consultant Paramètres de configuration incorrects sur le commutateur ou le contrôleur Incident : Réception d'une erreur de connexion lors de l'ajout d'un consultant
Pondérations non actualisées sur le commutateur Communication entre le contrôleur et le commutateur impossible ou interrompue Incident : Pondérations non actualisées sur le commutateur
La commande de régénération n'a pas actualisé la configuration du consultant Communication entre le commutateur et le contrôleur impossible ou interrompue Incident : La commande d'actualisation n'a pas mis à jour la configuration du consultant
Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux. La mémoire est insuffisante pour permettre à Java de traiter une modification de l'interface graphique de cette ampleur Incident : Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux
Déconnexion de l'hôte lors de l'administration Web à distance via Netscape Cette déconnexion se produit lors du redimensionnement de la fenêtre du navigateur Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web
Sur la plateforme Windows, des caractères nationaux Latin-1 endommagés apparaissent sur la ligne de commande Modifiez les propriétés des polices de la fenêtre d'invite de commande Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande
Sur la plateforme HP-UX, le message suivant est généré : java.lang.OutOfMemoryError unable to create new native thread Certaines installations HP-UX autorisent par défaut 64 unités d'exécution par processus. Cela est suffisant. Incident : Sous HP-UX, la mémoire est insuffisante pour Java et une erreur d'unité d'exécution est générée
Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de session de terminal à partir de laquelle ils ont été lancés Utilisez la commande nohup afin que les processus lancés ne reçoivent pas un signal d'arrêt lorsque vous quittez la session de terminal. Incident : Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de terminal à partir de laquelle ils ont été lancés
Tableau 16. Tableau de résolution des incidents de Nortel Alteon Controller
Symptôme Cause possible Voir...
échec du lancement de nalserver Conflit de numéros de port Vérification des numéros de port Nortel Alteon Controller
La commande nalcontrol ou lbadmin n'a pas abouti, le message ‘Le serveur ne répond pas' ou ‘Impossible d'accéder au serveur RMI' s'affiche Echec des commandes en raison d'une pile mise sur "sock". Ou les commandes n'ont pas abouti car nalserver n'a pas été lancé. Incident : La commande nalcontrol ou lbadmin n'a pas abouti
Erreur de réception : Impossible de créer un registre sur le port 14099 Licence du produit expirée Incident : Impossible de créer un registre sur le port 14099
Comportement inattendu de l'interface graphique lors de l'utilisation de Windows avec une carte vidéo Matrox AGP Incident lors de l'utilisation de cartes Matrox AGP en cours d'exécution de l'interface graphique de Load Balancer Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP
Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux. La mémoire est insuffisante pour permettre à Java de traiter une modification de l'interface graphique de cette ampleur Incident : Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux
Déconnexion de l'hôte lors de l'administration Web à distance via Netscape Cette déconnexion se produit lors du redimensionnement de la fenêtre du navigateur Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web
Réception d'une erreur de connexion lors de l'ajout d'un consultant Paramètres de configuration incorrects sur le commutateur ou le contrôleur Incident : Réception d'une erreur de connexion lors de l'ajout d'un consultant
Pondérations non actualisées sur le commutateur Communication entre le contrôleur et le commutateur impossible ou interrompue Incident : Pondérations non actualisées sur le commutateur
La commande de régénération n'a pas actualisé la configuration du consultant Communication entre le commutateur et le contrôleur impossible ou interrompue Incident : La commande d'actualisation n'a pas mis à jour la configuration du consultant
Sur la plateforme Windows, des caractères nationaux Latin-1 endommagés apparaissent sur la ligne de commande Modifiez les propriétés des polices de la fenêtre d'invite de commande Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande
Sur la plateforme HP-UX, le message suivant est généré : java.lang.OutOfMemoryError unable to create new native thread Certaines installations HP-UX autorisent par défaut 64 unités d'exécution par processus. Cela est suffisant. Incident : Sous HP-UX, la mémoire est insuffisante pour Java et une erreur d'unité d'exécution est générée
Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de session de terminal à partir de laquelle ils ont été lancés Utilisez la commande nohup afin que les processus lancés ne reçoivent pas un signal d'arrêt lorsque vous quittez la session de terminal. Incident : Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de terminal à partir de laquelle ils ont été lancés
Tableau 17. Tableau de dépannage du système Metric Server
Symptôme Cause possible Voir...
IOException Metric Server sous Windows lors de l'exécution de fichiers de mesures utilisateur de format BAT ou CMD Le nom complet des mesures est obligatoire Incident : IOException Metric Server sous Windows lors de l'exécution de fichiers de mesures utilisateur de format .bat or .cmd
Le système Metric Server ne fournit pas à la machine Load Balancer les informations relatives à la charge. Causes possibles :
  • absence de fichier de clés sur la machine Metric Server
  • nom d'hôte de la machine Metric Server non enregistré sur le serveur de noms local
  • nom d'hôte local du fichier /etc/hosts converti à l'adresse de bouclage 127.0.0.1
Incident : Metric Server n'indique pas la charge à la machine Load Balancer
L'entrée "Signature is necessary for access to agent" (signature nécessaire pour accéder à l'agent) apparaît dans le journal de la machine Metric Server lors du transfert des fichiers de clés vers le serveur Echec de l'autorisation du fichier de clés en raison d'une altération. Incident : Le journal de la machine Metric Server indique qu'une signature est nécessaire pour accéder à l'agent
Sur les systèmes AIX, lorsque Metric Server s'exécute dans des conditions difficiles sur un système multiprocesseur (AIX 5.1), il est possible que le résultat de la commande ps -vg soit altéré Le correctif APAR IY33804 rectifie cet incident AIX identifié Incident : Sur les systèmes AIX, lorsque Metric Server s'exécute dans des conditions difficiles, il est possible que le résultat de la commande ps –vg soit altéré
Configuration de Metric Server dans une configuration de second niveau avec équilibrage de la charge entre des machines Dispatcher haute disponibilité par Site Selector Metric Server (dans une configuration de second niveau) n'est pas configuré pour écouter une nouvelle adresse IP. Incident : Configuration de Metric Server dans une configuration de second niveau avec équilibrage de la charge entre des machines Dispatcher haute disponibilité par Site Selector
Les scripts (metricserver, cpuload, memload) exécutés sur des machines Solaris dotées de plusieurs CPU génèrent des messages de console non souhaités Ce comportement est dû à l'utilisation de la commande système VMSTAT pour collecter des statistiques sur la CPU et la mémoire à partir du noyau. Incident : Les scripts exécutés sur des machines Solaris dotées de plusieurs CPU génèrent des messages de console non souhaités
Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de session de terminal à partir de laquelle ils ont été lancés Utilisez la commande nohup afin que les processus lancés ne reçoivent pas un signal d'arrêt lorsque vous quittez la session de terminal. Incident : Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de terminal à partir de laquelle ils ont été lancés
La valeur de mesure renvoie -1 après le démarrage de Metric Server Cet incident peut provenir de la perte d'intégrité des fichiers de clés lors de leur transfert au client. Incident : Après le démarrage de Metric Server, la valeur de mesure renvoie -1

Vérification des numéros de port Dispatcher

En cas d'incidents lors de l'exécution de Dispatcher, il se peut que l'une des applications utilise un numéro de port généralement utilisé par Dispatcher. Notez que le serveur Dispatcher utilise les numéros de port suivants :

Si une autre application utilise l'un des numéros de port Dispatcher, vous pouvez modifier les numéros de port de Dispatcher ou modifier le numéro de port de l'application.

Pour modifier les numéros de port Dispatcher, procédez comme suit :

Modifiez le numéro du port RMI de l'application, comme suit :

Remarque :
Pour la plateforme Windows, les fichiers dsserver et metricserver se trouvent dans le répertoire <root_install>ibm\edge\lb\bin. Pour les autres plateformes, ces fichiers se trouvent dans le répertoire /usr/bin/.

Vérification des numéros de port CBR

En cas d'incidents lors de l'exécution de CBR, il se peut que l'une des applications utilise un numéro de port généralement utilisé par CBR. Prenez en compte que CBR utilise le numéro de port suivant :

Remarque :
Le composant Content Based Routing (CBR) n'est pas disponible sur les plateformes qui exécutent la machine virtuelle Java 64 bits, à l'exception de HP-UX ia64. Sous HP-UX ia64, le composant CBR exécute une application de 32 bits. Vous pouvez utiliser la méthode de réacheminement CBR du composant Load Balancer's Dispatcher afin de fournir un routage basé sur le contenu sans l'utilisation de Caching Proxy. Pour plus de détails, voir Fonction CBR de Dispatcher (méthode d'acheminement cbr).

Si une autre application utilise l'un des numéros de port CBR, vous pouvez modifier les numéros de port de CBR ou modifier le numéro de port de l'application.

Pour modifier les numéros de port CBR, procédez comme suit :

Modifiez le numéro du port RMI de l'application, comme suit :

Remarque :
Pour la plateforme Windows, les fichiers cbrserver et metricserver se trouvent dans le répertoire <root_install>ibm\edge\lb\bin. Pour les autres plateformes, ces fichiers se trouvent dans le répertoire /usr/bin/.

Vérification des numéros de port Site Selector

En cas d'incidents lors de l'exécution du composant Site Selector, il se peut que l'une des applications utilise un numéro de port généralement utilisé par Site Selector. Prenez en compte le fait que Site Selector utilise les numéros de port suivants :

Si une autre application utilise l'un des numéros de port Site Selector, vous pouvez modifier les numéros de port de Site Selector ou modifier le numéro de port de l'application.

Pour modifier les numéros de port de Site Selector, procédez comme suit :

Modifiez le numéro du port RMI de l'application, comme suit :

Remarque :
Pour la plateforme Windows, les fichiers ssserver et metricserver se trouvent dans le répertoire <root_install>ibm\edge\lb\bin. Pour les autres plateformes, ces fichiers se trouvent dans le répertoire /usr/bin/.

Vérification des numéros de port Cisco CSS Controller

En cas d'incidents lors de l'exécution du composant Cisco CSS Controller, il se peut qu'une autre application utilise l'un des numéros de port utilisés par le serveur lbcserver de Cisco CSS Controller. Prenez en compte le fait que Cisco CSS Controller utilise les numéros de port suivants :

Si une autre application utilise l'un des numéros de port Cisco CSS Controller, vous pouvez modifier les numéros de port de Cisco CSS Controller ou modifier le numéro de port de l'application.

Pour modifier les numéros de port Cisco CSS Controller, procédez comme suit :

Modifiez le numéro du port RMI de l'application, comme suit :

Remarque :
Pour la plateforme Windows, les fichiers ccoserver et metricserver se trouvent dans le répertoire <root_install>ibm\edge\lb\bin. Pour les autres plateformes, ces fichiers se trouvent dans le répertoire /usr/bin.

Vérification des numéros de port Nortel Alteon Controller

En cas d'incidents lors de l'exécution du composant Nortel Alteon Controller, il se peut qu'une autre application utilise l'un des numéros de port utilisés par le serveur nalserver de Nortel Alteon Controller. Prenez en compte le fait que Nortel Alteon Controller utilise les numéros de port suivants :

Si une autre application utilise l'un des numéros de port Nortel Alteon Controller, vous pouvez modifier les numéros de port de Nortel Alteon Controller ou modifier le numéro de port de l'application.

Pour modifier les numéros de port Nortel Alteon Controller, , procédez comme suit :

Modifiez le numéro du port RMI de l'application, comme suit :

Remarque :
Pour la plateforme Windows, les fichiers nalserver et metricserver se trouvent dans le répertoire <root_install>ibm\edge\lb\bin. Pour les autres plateformes, ces fichiers se trouvent dans le répertoire /usr/bin.

Résolution des incidents courants—Dispatcher

Incident : Dispatcher ne fonctionne pas

Cet incident peut se produire lorsqu'une autre application utilise l'un des ports utilisés par Dispatcher. Pour plus d'informations, voir Vérification des numéros de port Dispatcher.

Incident : Le répartiteur et le serveur ne répondent pas

Cet incident se produit lorsque qu'une adresse autre que l'adresse spécifiée est utilisée. Lorsque vous placez le Dispatcher et le serveur sur le même poste, assurez-vous que l'adresse NFA est utilisée ou est configurée comme utilisant le même poste. Vérifiez l'adresse dans le fichier hôte.

Incident : Les requêtes Dispatcher ne sont pas équilibrées

Les symptômes de cet incident sont l'absence de prise en charge des connexions des machines client ou le dépassement du délai des connexions. Effectuez les contrôles suivants pour diagnostiquer cet incident :

  1. Avez-vous configuré l'adresse de non-réacheminement, les clusters, les ports et les serveurs pour l'acheminement ? Vérifiez le fichier de configuration.
  2. L'alias de la carte d'interface de réseau est-il associé à l'adresse de cluster ? Pour les systèmes d'exploitation AIX, HP-UX, Linux et Solaris, utilisez netstat -ni pour vérifier.
  3. L'alias de l'unité de bouclage de chaque serveur est-il associé à l'adresse de cluster ? Pour les systèmes d'exploitation AIX, HP-UX, Linux et Solaris, utilisez netstat -ni pour vérifier.
  4. La voie d'acheminement supplémentaire est-elle supprimée ? Pour les systèmes d'exploitation AIX, HP-UX, Linux et Solaris, utilisez netstat -nr pour vérifier.
  5. Utilisez la commande dscontrol cluster status pour vérifier les informations relatives à chacun des clusters que vous avez définis. Assurez-vous qu'un port est défini pour chaque cluster.
  6. Utilisez la commande dscontrol server report :: pour vérifier que vos serveurs ne sont pas hors service ou qu'ils n'ont pas pour valeur une pondération égale à zéro.

Pour Windows et les autres plateformes, voir également Configuration des serveurs pour l'équilibrage de la charge.

Incident : La fonction haute disponibilité de Dispatcher est inopérante

Cet incident se produit lorsqu'un environnement de haute disponibilité de Dispatcher est configuré et que les connexions des machines client ne sont pas prises en charge ou que le délai imparti à ces connexions est dépassé. Effectuez les contrôles suivants pour corriger ou diagnostiquer l'incident :

Les opérations suivantes permettent de test efficacement le fonctionnement des scripts haute disponibilité :

  1. Collectez un rapport en exécutant les commandes netstat -an et ifconfig -a depuis la machine.
  2. Exécutez le script goActive.
  3. Exécutez le script goStandby.
  4. Générez une nouvelle fois un rapport en exécutant les commandes netstat -an et ifconfig -a

Ces deux rapports sont identiques si les scripts sont correctement configurés.

Incident : Impossible d'ajouter un signal de présence (plateforme Windows)

Cette erreur Windows se produit lorsque l'adresse source n'est pas configurée sur un adaptateur. Effectuez les contrôles suivants pour corriger ou diagnostiquer le problème.

Incident : Les conseillers ne fonctionnent pas correctement

Si vous utilisez un support de réseau étendu et que les conseillers ne semblent pas fonctionner correctement, vérifiez qu'ils sont bien lancés sur les répartiteurs locaux et éloignés.

Une commande ping ICMP est envoyée aux serveurs avant la demande du conseiller. S'il existe un pare-feu entre Load Balancer et les serveurs, vérifiez qu'il autorise les commandes ping. Si cette configuration pose un problème de sécurité pour votre réseau, modifiez l'instruction java dans dsserver pour désactiver toutes les commandes ping vers les serveurs en ajoutant la propriété java suivante :

LB_ADV_NO_PING="true"      
java  -DLB_ADV_NO_PING="true"

Voir Utilisation de conseillers éloignés avec le support de réseau étendu de Dispatcher.

Problème : Sur un serveur dorsal Windows Server 2008, memload.exe s'interrompt

Lorsque Load Balancer se connecte à un serveur dorsal qui exécute Windows Server 2008, les fonctions de collecte de mesures peuvent causer l'arrêt inattendu de l'application memload.exe.

L'interruption se produit car le registre Windows Server 2008 peut ne pas être rempli avec les clés de performance que ces outils requièrent. Cette interruption d'application doit être signalée à partir de l'application cpuload.

Consultez la rubrique de la base de connaissances suivante de Microsoft pour connaître les étapes de résolution de ce problème : http://support.microsoft.com/kb/300956

Incident : Dispatcher, Microsoft IIS et SSL ne fonctionnent pas (plateformeWindows)

Lorsque vous utilisez Dispatcher, Microsoft IIS et SSL, s'ils ne fonctionnent pas ensemble, il se peut qu'un incident lié à la sécurité SSL se soit produit. Pour plus d'informations sur la génération d'une paire de clés, l'acquisition d'un certificat, l'installation d'un certificat avec une paire de clés et la configuration d'un répertoire pour SSL, reportez-vous à la documentation Microsoft Information and Peer Web Services.

Incident : Connexion du répartiteur à une machine éloignée

Dispatcher utilise des clés pour vous permettre de vous connecter à une machine éloignée et la configurer. Les clés indiquent un port RMI pour la connexion. Il est possible de changer de port RMI pour des raisons de sécurité ou de conflits. Lorsque vous changez les ports RMI, le nom de fichier ou la clé est différent(e). Si votre répertoire contient plusieurs clés pour la même machine éloignée et qu'elles indiquent des ports RMI différents, la ligne de commande essaie la première qu'elle trouve. Si elle n'est pas appropriée, la connexion est refusée. La connexion ne sera établie que si vous supprimez la clé incorrecte.

Incident : La commande dscontrol ou lbadmin n'a pas abouti

  1. La commande dscontrol renvoie : Erreur : Pas de réponse du serveur. Ou la commande lbadmin renvoie : Erreur : impossible d'accéder au serveur RMI. Ces erreurs peuvent se manifester lorsque votre machine a une pile sur "sock". Pour corriger ce problème, éditez le fichier socks.cnf pour qu'il contienne les lignes suivantes :
    EXCLUDE-MODULE java
    EXCLUDE-MODULE javaw
  2. Les consoles d'administration des interfaces Load Balancer (ligne de commande, interface graphique et assistants) communiquent avec dsserver par appels RMI (Remote Method Invocation). Par défaut, la communication utilise trois ports : chacun étant défini dans le script de démarrage de dsserver :

    Ceci peut être source de problèmes lorsqu'une des consoles d'administration s'exécute sur la même machine qu'un pare-feu ou passe par un pare-feu. Par exemple, lorsque vous émettez des commandes dscontrol alors que Load Balancer s'exécute sur la même machine qu'un pare-feu, des erreurs de type Erreur : Pas de réponse du serveur peuvent s'afficher.

    Pour éviter ce type d'incident, modifiez le fichier script ndserver afin de définir le port qu'utilise RMI pour le pare-feu (ou autre application). Remplacez la ligne LB_RMISERVERPORT=10199 par LB_RMISERVERPORT=votrePort. Où votrePort est un autre port.

    Lorsque vous avez terminé, relancez la commande dsserver et ouvrez le trafic des ports 10099, 10004, 10199 et 10100 ou du port d'adresse hôte choisi pour l'exécution de la console d'administration.

  3. Ces erreurs peuvent également se produire si vous n'avez pas encore lancé dsserver.
  4. S'il existe plusieurs adaptateurs sur la machine, vous devez désigner celui à utiliser par dsserver en ajoutant la ligne suivante dans le script dsserver :java.rmi.server.hostname=<nom_hôte ou adresseIP>

    Par exemple : java -Djava.rmi.server.hostname="10.1.1.1"

Incident : Message d'erreur “Impossible de trouver le fichier..." Message d'erreur lors de la tentative d'afficher l'aide en ligne (plateforme Windows)

Sur les plateformes Windows, lorsque vous utilisez Netscape comme navigateur par défaut, le message d'erreur suivant peut s'afficher : “Impossible trouver fichier '<nomfichier>.html' (ou un de ses composants). Vérifiez que le chemin et le nom de fichier sont corrects et que toutes les bibliothèques nécessaires sont disponibles.

Le problème est dû à un réglage incorrect pour l'association de fichier HTML. La solution est la suivante :

  1. Cliquez sur Poste de travail, puis sur Outils, sélectionnez Options des dossiers et cliquez sur l'onglet Types de fichiers
  2. Sélectionnez “Document hypertexte Netscape"
  3. Cliquez sur le bouton Avancé, sélectionnez ouvrir, cliquez sur le bouton Editer
  4. Entrez NSShell dans la zone Application : (et non dans la zone Application utilisée pour réaliser action : ), puis cliquez sur OK

Incident : L'interface graphique ne démarre pas correctement

Pour que l'interface graphique, lbadmin, fonctionne correctement, vous devez disposer d'une quantité d'espace de pagination suffisante. Dans le cas contraire, l'interface graphique peut ne pas démarrer complètement. Si cela se produit, vérifiez l'espace de pagination et augmentez-la si nécessaire.

Incident : Erreur lors de l'exécution de Dispatcher lorsque Caching Proxy est installé

Si vous désinstallez Load Balancer afin de réinstaller une autre version et que vous obtenez une erreur lorsque vous tentez de lancer le composant Dispatcher, vérifiez si Caching Proxy est installé. Caching Proxy est lié à un des fichiers Dispatcher. Ce fichier sera désinstallé lors de la désinstallation de Caching Proxy.

Pour résoudre ce problème :

  1. Désinstallez Caching Proxy.
  2. Désinstallez Load Balancer.
  3. Réinstallez Load Balancer et Caching Proxy.

Incident : L'interface graphique ne s'affiche pas correctement.

Si des incidents se produisent relatifs à l'apparence de l'interface graphique de Load Balancer, vérifiez la configuration de la résolution du bureau du système d'exploitation. Pour un affichage de l'interface graphique optimal, nous vous recommandons d'utiliser une résolution de 1024x768 pixels.

Incident : Sous Windows, les fenêtre d'aide disparaissent parfois sous d'autres fenêtres ouvertes

Sous Windows, lorsque vous ouvrez des fenêtres d'aide, elles peuvent disparaître en arrière-plan sous les fenêtres existantes. Si cela se produit, cliquez sur la fenêtre pour qu'elle s'affiche à nouveau en premier plan.

Incident: Load Balancer ne peut pas traiter et transmettre un cadre

Sous Solaris, chaque carte réseau possède la même adresse MAC par défaut. Cela fonctionne correctement lorsque chaque carte se trouve sur un sous-réseau IP différent. Cependant, dans un environnement commuté, lorsque plusieurs cartes NIC ayant la même adresse MAC et la même adresse de sous-réseau IP communiquent avec le même commutateur, ce dernier envoie l'ensemble du trafic associé à l'adresse MAC (et aux adresses IP) via le même câble. Seule la carte ayant la dernière placé un cadre sur ce réseau voit les paquets IP associés aux deux cartes. Solaris peut ignorer les paquets d'une adresse IP valide arrivant à l'interface "incorrecte".

Si toutes les interfaces réseau ne sont pas conçues pour Load Balancer, conformément à la configuration définie dans le fichier ibmlb.conf et si la carte NIC non définie dans ibmlb.conf reçoit un cadre, Load Balancer ne peut pas traiter et transmettre le cadre.

Pour éviter ce problème, vous devez remplacer la valeur par défaut et définir une adresse unique pour chaque interface. Utilisez cette commande :

ifconfig interface ether adrMac

Par exemple :

ifconfig eri0 ether 01:02:03:04:05:06

Incident : Un écran bleu s'affiche lors du démarrage de l'exécuteur Load Balancer

Sous Windows, vous devez avoir une carte réseau installée et configurée avant le démarrage de l'exécuteur.

Incident : La fonction Path MTU Discovery permet d'éviter le trafic retour avec Load Balancer

Le système d'exploitation AIX contient une fonction de mise en réseau appelée “Path MTU Discovery”. Lors d'une transaction avec un client, si le système d'exploitation détermine qu'une unité de transmission maximale (MTU) inférieure doit être utilisée pour les paquets sortants, la fonction Path MTU Discovery entraîne la création par AIX d'une route de rappel de cette unité. La nouvelle route est réservée à cette adresse IP client et enregistre l'unité MTU qui permet d'atteindre celle-ci.

Lors de la création de la route, un incident peut survenir sur les serveurs en raison de l'association du cluster à un alias sur l'unité de bouclage. Si l'adresse de la passerelle pour la route entre dans le sous-réseau du cluster ou du masque réseau, les systèmes AIX créent la route sur l'unité de bouclage. Cet événement s'est produit car il s'agissait de l'alias de la dernière interface associé à ce sous-réseau.

Par exemple, si le cluster s'appelle 9.37.54.69, le masque réseau 255.255.255.0 et la passerelle prévue 9.37.54.1, les systèmes AIX utilisent l'unité de bouclage pour la route. En raison de cette action, les réponses du serveur ne sortent jamais et le client dépasse le délai d'attente. Habituellement, le client voit une réponse du cluster, puis il ne reçoit plus rien lorsque la route est créée.

Pour résoudre ce problème, exécutez la commande suivante :

/usr/sbin/no -p -o udp_pmtu_discover=0
/usr/sbin/no -p -o tcp_pmtu_discover=0

Cette commande rend les valeurs persistantes et les valeurs sont appliquées aux valeurs de redémarrage en cours et futures.

Incident : La fonction haute disponibilité de Load Balancer en mode réseau étendu est inopérante

Lorsque vous configurez un mode WAND (Wide Area Load Balancer), vous devez définir la machine Dispatcher locale en tant que serveur d'un cluster sur la machine Dispatcher locale. Habituellement, vous utilisez l'adresse de non-réacheminement (NFA) de la machine Dispatcher éloignée pour l'adresse de destination du serveur éloigné. Dans ce cas, si vous configurez ensuite sur le répartiteur distant la fonction haute disponibilité, cette dernière reste inopérante. La cause en est la suivante : la machine Dispatcher locale désigne toujours la machine principale côté éloigné lorsque vous utilisez l'adresse NFA.

Pour éviter cet incident :

  1. Définissez un autre cluster sur le composant Dispatcher distant. Il n'est pas nécessaire de définir des ports ou des serveurs pour ce cluster.
  2. Ajoutez l'adresse de ce cluster dans les scripts goActive et goStandy.
  3. Sur la machine Dispatcher locale, définissez l'adresse de cluster en tant que serveur, et non en tant qu'adresse NFA de la machine Dispatcher principale éloignée.

Lorsque la machine Dispatcher principale éloignée entre en service, elle associe cette adresse à un alias sur la carte, permettant ainsi l'acceptation du trafic. En cas de défaillance, l'adresse se déplace sur la machine de secours qui continue à accepter le trafic destiné à cette adresse.

Incident : Arrêt (ou comportement imprévu) de l'interface graphique lors de la tentative de chargement d'un fichier de configuration volumineux

Lors de l'utilisation d'une administration lbadmin ou Web (lbwebaccess) pour charger un fichier de configuration volumineux (200 commandes add ou même plus), l'interface graphique peut s'arrêter ou avoir un comportement imprévu, comme présenter un temps de réponse excessif lorsque vous apportez des modifications à l'écran.

Cela vient du fait que la mémoire est insuffisante pour permettre à Java de traiter une configuration de cette ampleur.

L'environnement d'exécution dispose d'une option permettant d'augmenter la mémoire disponible dont peut disposer Java.

Il s'agit de l'option -Xmxnn correspond à la taille maximale, en octets, de la mémoire. n doit être un multiple de 1024 et supérieur à 2 Mo. La valeur n peut être suivie du caractère k ou K pour indiquer qu'il s'agit de kilo-octets ou du caractère m ou M pour indiquer qu'il s'agit de méga-octets. Par exemple, -Xmx128M et -Xmx81920k sont valides. La valeur par défaut est 64M.

Par exemple, pour ajouter cette option, ouvrez le fichier script lbadmin, modifiez "javaw" en "javaw -Xmxn" comme suit. (Pour les systèmes AIX, modifiez "java" en "java -Xmxn") :

Aucune valeur n particulière n'est recommandée, mais elle doit être supérieure à l'option par défaut. Pour commencer, vous pouvez doubler cette dernière.

Incident : lbadmin se déconnecte du serveur après mise à jour de la configuration

Si l'administration (lbadmin) de Load Balancer se déconnecte du serveur après mise à jour de la configuration, vérifiez quelle version de dsserver vous essayez de configurer sur le serveur et vérifiez qu'il s'agit de la même version que celle de lbadmin ou dscontrol.

Incident : Adresses IP non résolues correctement sur la connexion éloignée

Lorsqu'un client éloigné est utilisé sur une implémentation SSL, des noms d'hôtes ou des noms de domaines complets ne sont pas correctement convertis en adresses IP au format d'adresse IP. L'implémentation SSL doit ajouter à la résolution des noms de domaines des données propres à la connexion.

Si les adresses IP ne sont pas correctement résolues sur la connexion éloignée, indiquez l'adresse IP au format d'adresse IP.

Incident : L'interface coréenne de Load Balancer affiche sous AIX et Linux des polices non souhaitées ou qui se chevauchent

Pour rectifier les problèmes de chevauchement de polices ou de polices indésirables sur l'interface Load Balancer coréenne, procédez comme suit :

Incident : Sous Windows, adresse d'alias renvoyée au lieu de l'adresse locale lors de l'émission de commandes telles que hostname

Sous Windows, lorsqu'un alias a été attribué à l'unité de bouclage de MS, le système d'exploitation renvoie l'adresse d'alias au lieu de l'adresse locale lors de l'émission d'une commande telle que hostname. Pour rectifier cette erreur, veillez à placer le nouvel alias au-dessous de l'adresse locale dans la liste des connexions réseau. Ainsi, l'adresse locale est utilisée avant l'alias de bouclage.

Pour consulter la liste des connexions réseau, procédez comme suit :

  1. Cliquez sur Démarrer > Paramètres > Connexions réseau et accès à distance
  2. 0 partir de l'option de menu Avancé, sélectionnez Paramètres avancés...
  3. Vérifiez que Connexion locale figure en premier dans la liste Connexions.
  4. Au besoin, utilisez les boutons situés à droite pour déplacer les entrées vers le haut ou le bas de la liste.

Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP

Sous Windows, l'interface graphique de Load Balancer peut se comporter de manière inattendue lorsque vous utilisez une carte vidéo Matrox AGP. Lorsque vous cliquez sur un bouton de la souris, un espace légèrement plus large que le pointeur de la souris peut être altéré avec inversion possible de la mise en évidence ou déplacement des images sur l'écran. Les anciennes cartes Matrox n'ont pas présenté ce type de comportement. Il n'existe pas de rectificatif pour les cartes Matrox AGP.

Incident : Comportement inattendu lors de l'exécution de "rmmod ibmlb" (systèmes Linux)

Sur les systèmes Linux, si dsserver est encore actif lors du retrait manuel du module Load Balancer du noyau, un comportement inattendu, tel qu'un arrêt du système ou des noyaux java, peut se produire. Avant de retirer manuellement du noyau le module Load Balancer, vous devez arrêter dsserver.

Si la commande "dsserver stop" ne fonctionne pas, arrêtez le processus Java avec SRV_KNDConfigServer. Pour arrêtez le processus, recherchez l'identifiant correspondant à l'aide de la commande ps -ef | grep SRV_KNDConfigServer, puis mettez fin à ce processus à l'aide de la commande kill id_processus.

Vous pouvez, en toute sécurité, exécuter la commande "rmmod ibmlb" de retrait du noyau du module Load Balancer.

Incident : Temps de réponse long lors de l'exécution de commandes sur la machine Dispatcher.

Si vous exécutez le composant Dispatcher pour l'équilibrage de charge, le trafic client peut surcharger l'ordinateur. Le module Load Balancer du noyau est hautement prioritaire, et s'il gère constamment des paquets de clients, il est possible que le reste du système ne réponde plus. L'exécution de commandes dans l'espace utilisateur peut être très longue ou ne jamais se terminer.

Dans ce cas, vous devez restructurer votre configuration de sorte que le trafic ne surcharge pas la machine Load Balancer. Vous pouvez également répartir la charge sur plusieurs machines Load Balancer ou remplacer votre machine par un ordinateur plus performant et plus rapide.

Lorsque vous essayez de déterminer si la longueur des temps de réponse provient d'un volume important de trafic client, vérifiez si cela se produit aux heures de pointe. Une mauvaise configuration des systèmes entraînant des boucles de routage peut provoquer le même incident. Mais avant de modifier la configuration de Load Balancer, vérifiez si les symptômes ne sont pas liés à une charge trop importante au niveau du client.

Incident : Le conseiller SSL ou HTTPS n'enregistre pas les charges des serveurs (avec l'acheminement MAC)

Lorsque vous utilisez la méthode d'acheminement MAC, Load Balancer envoie des paquets aux serveurs en utilisant l'adresse du cluster pour laquelle un alias a été défini sur l'unité de bouclage. Certaines applications serveurs (telle SSL) exigent que les informations de configuration (tels les certificats) soient définies en fonction de l'adresse IP. L'adresse IP doit être l'adresse du cluster configurée sur l'unité de bouclage de façon à correspondre au contenu des paquets entrants. Si vous ne configurez pas l'application serveur avec l'adresse IP du cluster, la demande client n'est pas correctement acheminée vers le serveur.

Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web

Lorsque vous utilisez l'administration Web à distance pour configurer Load Balancer, ne modifiez pas la taille (Réduire, Agrandir, Restaurer en bas, etc.) du navigateur Netscape dans lequel s'affiche l'interface graphique de Load Balancer. En effet, étant donné que Netscape recharge une page à chaque redimensionnement de la fenêtre du navigateur, une déconnexion de l'hôte en découle. Vous devez donc vous reconnecter à l'hôte après chaque modification de la taille de la fenêtre. Pour l'administration à distance basée sur le Web sur une plateforme Windows, utilisez Internet Explorer.

Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande

Dans une fenêtre de ligne de commande du système d'exploitation Windows, certains caractères nationaux de la famille Latin-1 sont altérés. Par exemple, la lettre "a" avec tilde s'affiche sous la forme d'un symbole pi. Pour rectifier cette erreur, vous devez modifier les propriétés de police de la fenêtre d'invite de commande. Pour modifier la police, procédez comme suit :

  1. Cliquez sur l'icône située dans l'angle supérieur gauche de la fenêtre d'invite de commande.
  2. Sélectionnez Propriétés, puis cliquez sur l'onglet Police.
  3. La police par défaut est Raster ; remplacez-la par Lucida Console, puis cliquez sur OK.

Problème : Sur HP-UX, la mémoire est insuffisante pour Java ou une erreur d'unité d'exécution est générée

Certaines installations HP-UX 11i sont préconfigurées pour n'autoriser que 64 unités d'exécution par processus. Toutefois, certaines configurations Load Balancer en requièrent davantage. Pour les systèmes HP-UX, définissez les unités d'exécution par processus sur 256 au moins. Pour augmenter cette valeur, utilisez l'utilitaire "sam" pour définir le paramètre de noyau max_thread_proc. Si vous pensez avoir besoin d'un nombre d'unités d'exécution plus important, vous pouvez affecter à ce paramètre une valeur supérieure à 256.

Pour augmenter la valeur du paramètre max_thread_proc, procédez comme suit :

  1. A partir de la ligne de commande, entrez : sam
  2. Sélectionnez Configuration du noyau > Paramètres configurables
  3. A partir de la barre de défilement, sélectionnez max_thread_proc
  4. Appuyez sur la barre d'espace pour sélectionner max_thread_proc
  5. Appuyez une fois sur la touche de tabulation, puis sur la flèche de droite jusqu'à ce vous puissiez sélectionner Actions
  6. Appuyez sur Entrée pour afficher le menu Actions, puis appuyez sur M pour sélectionner l'option de modification des paramètres configurables. (Si vous ne trouvez pas cette option, sélectionnez max_thread_proc)
  7. Appuyez sur la touche de tabulation jusqu'à ce que vous puissiez sélectionner la zone Formule/Valeur
  8. Entrez une valeur égale ou supérieure à 256.
  9. Cliquez sur OK
  10. Appuyez une fois sur la touche de tabulation, puis sélectionnez Actions
  11. Appuyez sur la touche K pour traiter le nouveau noyau.
  12. Sélectionnez Oui
  13. Réinitialisez votre système

Incident : Sous Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés

Lorsque vous configurez votre adaptateur sur une machine Load Balancer, vous devez vérifier que les deux paramètres suivants sont corrects pour que le conseiller puisse fonctionner :

Incident : Sous Windows, la résolution de l'adresse IP en nom d'hôte n'est pas possible lorsque plusieurs adresses sont configurées sur un adaptateur

Sous Windows, lorsque vous configurez un adaptateur avec plusieurs adresses IP, configurez d'abord dans le registre l'adresse IP à affilier au nom d'hôte.

Load Balancer dépendant de InetAddress.getLocalHost() dans de nombreuses instances (par exemple, lbkeys create), l'attribution comme alias de plusieurs adresses IP à un même adaptateur peut être source d'incident. Pour éviter cela, entrez l'adresse IP à utiliser pour la résolution du nom d'hôte en premier dans le registre. par exemple :

  1. Démarrez Regedit
  2. Modifiez les noms de valeur ci-après de la manière suivante :
  3. Réinitialisez la machine
  4. Vérifiez que votre nom d'hôte est converti en l'adresse IP appropriée. Par exemple, ping votrenomhôte.

Incident : Sous Windows, les conseillers ne fonctionnent pas dans une configuration en haute disponibilité après une panne réseau

Par défaut, lorsque le système d'exploitation Windows détecte une panne réseau, il efface sa mémoire cache ARP (protocole de résolution d'adresse) et toutes les entrées statiques. Lorsque le réseau est à nouveau disponible, la mémoire cache ARP est de nouveau alimentée par les demandes ARP envoyées sur le réseau.

Dans une configuration en haute disponibilité, les deux serveurs assurent les opérations principales lorsqu'une perte de la connectivité réseau affecte l'un d'eux. Lorsque la demande ARP est envoyée pour alimenter la mémoire cache ARP, les deux serveurs répondent et la mémoire cache ARP marque alors l'entrée comme non valide. Par conséquent, les conseillers ne peuvent pas créer de socket vers les serveurs de secours.

Vous pouvez résoudre cet incident en empêchant Windows d'effacer la mémoire cache ARP lors d'une perte de connectivité. Microsoft a publié un article expliquant comment effectuer cette tâche. Cet article se trouve sur le site Web Microsoft dans la base de connaissances Microsoft sous la référence 239924: http://support.microsoft.com/default.aspx?scid=kb;en-us;239924.

Vous trouverez ci-après un récapitulatif des étapes, décrites dans l'article Microsoft, permettant d'empêcher le système d'effacer la mémoire cache ARP.

  1. Utilisez l'éditeur de registre (regedit ou regedit32) pour ouvrir le registre.
  2. Affichez la clé suivante du registre :
    HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\Tcpip\Parameters
  3. Ajoutez la valeur de registre suivante : Nom de la valeur : DisableDHCPMediaSense Type de valeur : REG_DWORD.
  4. Une fois que vous avez ajouté cette clé, éditez-la et affectez-lui la valeur 1.
  5. Réinitialisez la machine pour que la modification soit appliquée.
Remarque :
Cette opération affecte la mémoire cache ARP, quelle que soit la valeur du paramètre DHCP.

Incident : Sous Linux, n'utilisez pas la commande "IP address add" lors de l'affectation d'alias à plusieurs clusters de l'unité de bouclage

Certaines considérations doivent être prises en compte lors de l'utilisation de serveurs Linux (noyau 2.4.x) et de la méthode d'acheminement MAC de Dispatcher. Si une adresse de cluster a été configurée pour le serveur sur l'unité de bouclage à l'aide de la commande ip address add , vous ne pouvez attribuez un alias qu'à une seule adresse de cluster.

Lorsque vous affectez un alias à plusieurs clusters sur l'unité de bouclage, utilisez la commande ifconfig (par exemple,

ifconfig lo:num clusterAddress netmask 255.255.255.255 up 

En outre, les méthodes de configuration d'interface ifconfig et ip sont incompatibles. La meilleure pratique consiste, pour un site, à choisir une méthode et à ne pas en changer.

Incident : Message d'erreur "Adresse de routeur non spécifiée ou non valide pour la méthode port"

Lors de l'ajout de serveurs à la configuration Dispatcher, le message d'erreur suivant peut être généré : "Erreur : Adresse de routeur non spécifiée ou non valide pour la méthode port".

Utilisez cette liste de contrôle pour identifier l'incident :

Par défaut, le paramètre router a la valeur 0, ce qui indique que le serveur est local. Lorsque vous définissez l'adresse du routeur du serveur à une valeur autre que 0, cela indique qu'il s'agit d'un serveur éloigné, installé dans un sous-réseau différent. Pour plus d'informations sur le paramètre router dans la commande d'ajout d'un serveur, voir dscontrol server — Configuration des serveurs.

Si le serveur ajouté est installé dans un sous-réseau différent, le paramètre router doit correspondre à l'adresse du routeur devant être utilisé dans le sous-réseau local pour communiquer avec le serveur éloigné.

Incident : Sur les systèmes Solaris, les processus Load Balancer s'arrêtent lorsque vous quittez la fenêtre de terminal à partir de laquelle ils ont été lancés

Sur les systèmes Solaris, si vous démarrez les scripts Load Balancer (tels que dsserver ou lbadmin) à partir d'une fenêtre de terminal et que vous quittez cette dernière, le processus Load Balancer s'arrête.

Pour résoudre cet incident, démarrez les scripts Load Balancer à l'aide de la commande nohup. Par exemple : nohup dsserver. Cette commande permet d'éviter que les processus lancés à partir de la session de terminal ne reçoive un signal d'arrêt du terminal lorsque ce dernier est fermé. L'exécution du processus peut ainsi se poursuivre même après la fermeture de la session de terminal. Spécifiez la commande nohup avant les scripts Load Balancer dont le traitement doit continuer après la fermeture d'une session de terminal.

Incident : Délai lors du chargement d'une configuration Load Balancer

Le chargement d'une configuration Load Balancer peut prendre un certain temps en raison des appels DNS effectués pour résoudre et vérifier l'adresse du serveur.

Si le système DNS de la machine Load Balancer n'est pas correctement configuré ou s'il prend du temps, le chargement de la configuration en est ralenti à cause de l'envoi des demandes DNS sur le réseau par les processus Java.

Une solution consiste à ajouter les adresses et les noms d'hôte du serveur au fichier local /etc/hosts.

Incident : Sur les systèmes Windows, un message d'erreur lié à un conflit d'adresses IP apparaît à l'écran

Si la fonction de haute disponibilité est configurée, il est possible que des adresses de cluster soient définies sur les deux systèmes pendant une courte période et que le système génère l'affichage d'un message d'erreur pour indiquer un conflit d'adresses IP avec un autre système du réseau. Dans ce cas, vous pouvez ignorer ce message. Il est possible qu'une adresse de cluster soit configurée en même temps sur les deux systèmes de haute disponibilité, notamment lors du démarrage de chaque système ou lors de l'initiation d'une procédure de reprise.

Vérifiez les scripts go* pour vous assurer que vous avez défini ou supprimé correctement les configurations des adresses de cluster. Si vous avez exécuté un fichier de configuration et installé des scripts go*, vérifiez que des commandes "executor configure" n'ont pas été définies pour les adresses de cluster dans le fichier de configuration car ces commandes entrent en conflit avec les commandes de configuration et de suppression de configuration indiquées dans les scripts go*.

Pour plus d'informations sur les scripts go* lors de la configuration de la fonction de haute disponibilité, voir Utilisation de scripts.

Incident : Les machines principale et de secours sont toutes deux activées en mode haute disponibilité

Cet incident peut survenir lorsque les scripts go ne sont pas exécutés sur la machine principale ou la machine de secours. Ces scripts ne peuvent pas s'exécuter si dsserver n'est pas démarré sur les deux machines. Vérifiez sur les deux machines que dsserver est en cours d'exécution.

Incident : Les demandes client échouent lors de la tentative de renvoi de réponses de grande page

Les demandes client générant des réponses de grande page arrivent à expiration si la taille maximale en transmission (MTU) n'est pas définie correctement sur le répartiteur. En effet, pour les méthodes de transfert cbr et nat du composant Dispatcher, Dispatcher utilise la valeur MTU par défaut au lieu de la négocier.

La valeur MTU est définie sur chaque système d'exploitation en fonction du type de support de communication (par exemple, Ethernet ou Token-Ring). La valeur MTU des routeurs du segment local peut être inférieure si ces derniers se connectent à un autre type de support de communication. Dans le cas d'un trafic TCP normal, une négociation MTU survient lors de la configuration de la connexion et la valeur MTU la plus faible est utilisée pour envoyer des données entre les machines.

Dispatcher ne prend pas en charge la négociation de la valeur MTU pour sa méthode de transfert cbr ou nat car il est activement impliqué comme noeud final des connexions TCP. Pour les méthodes de transfert cbr et nat, Dispatcher utilise par défaut la valeur MTU 1500. Cette valeur correspondant à la taille type de MTU pour un réseau Ethernet standard, la plupart des clients n'ont pas besoin de la modifier.

Lorsque vous utilisez la méthode de transfert cbr ou nat de Dispatcher, si vous disposez d'un routeur vers le segment local dont la valeur MTU est la plus faible, vous devez définir la même valeur MTU sur le répartiteur.

Pour résoudre cet incident, définissez la taille de segment maximale (mss) à l'aide de la commande suivante : dscontrol executor set mss nouvelle_valeur

par exemple :

dscontrol executor set mss 1400 

La valeur par défaut de mss est 1460.

Le paramètre mss ne s'applique pas à la méthode de transfert mac de Dispatcher ou à tout composant de Load Balancer autre que Dispatcher.

Incident : Sous Windows, l'erreur "Le serveur ne répond pas" survient lors de l'exécution d'une commande dscontrol ou lbadmin

Lorsqu'il existe plusieurs adresses IP sur un système Windows et que le fichier hôte ne spécifie pas l'adresse à associer au nom d'hôte, le système d'exploitation choisit d'associer au nom d'hôte l'adresse la plus petite.

Pour résoudre cet incident, remplacez le fichier c:\Windows\system32\drivers\etc\hosts par le nom d'hôte de votre machine et l'adresse IP à lui associer.

IMPORTANT : L'adresse IP ne peut pas correspondre à une adresse de cluster.

Incident : Les machines Dispatcher à haute disponibilité risquent de ne pas être synchronisées sur les systèmes Linux pour S/390 avec des pilotes qeth

Lors de l'utilisation de la haute disponibilité sur des systèmes Linux pour S/390 avec le pilote réseau qeth, la synchronisation des machines Dispatcher active et de secours risque d'échouer. Il se peut que cet incident soit limiter au noyau 2.6 de Linux.

Si cet incident survient, procédez comme suit :

Définissez un périphérique réseau CTC (channel-to-channel- canal à canal) entre les images Dispatcher active et de secours et ajoutez un signal de présence entre les adresses IP des deux noeuds CTC.

Incident : Conseils sur la configuration de la haute disponibilité

Avec la fonction de haute disponibilité pour Load Balancer, une machine partenaire peut prendre le relais de l'équilibrage de charge en cas de défaillance ou d'arrêt du partenaire principal. Pour maintenir les connexions entre les deux partenaires, des enregistrements de connexion sont transmis entre les deux machines. Lorsque le partenaire de secours prend en charge la fonction d'équilibrage de charge, l'adresse IP de cluster est supprimée de la machine de secours et ajoutée dans la nouvelle machine principale. De nombreuses considérations temporelles et de configuration peuvent avoir un impact sur cette opération de reprise.

Les conseils répertoriés dans cette section peuvent répondre à des incidents potentiels de configuration de la haute disponibilité, comme :

Les conseils suivants sont pratiques pour garantir le succès de la configuration de la haute disponibilité sur les machines Load Balancer.

Remarque :
Pour plus d'informations sur la configuration de la fonction haute disponibilité, voir Haute disponibilité.

Incident : Sous Linux, la configuration de Dispatcher est limitée lorsque vous utilisez des serveurs zSeries ou S/390 dotés de cartes OSA (Open System Adapter)

En général, avec la méthode d'acheminement MAC, les serveurs de la configuration Load Balancer doivent tous se trouver sur le même segment de réseau, quelle que soit la plateforme. Les périphériques de réseau actifs comme le routeur, les passerelles et les pare-feux interfèrent avec Load Balancer. En effet, Load Balancer fonctionne comme un routeur spécialisé, modifiant uniquement les en-têtes de couche liaison de données pour son tronçon suivant et final. Toute topologie de réseau dans laquelle le tronçon suivant n'est pas final n'est pas valide pour Load Balancer.

Remarque :
Les tunnels, de type CTC (canal à canal) ou IUCV (inter-user communication vehicle), sont souvent pris en charge. Toutefois, Load Balancer doit utiliser directement le tunnel jusqu'à la destination finale pour son acheminement (il ne peut pas s'agir d'un tunnel réseau à réseau).

Il existe une limitation pour les serveurs zSeries et S/390 qui partagent la carte OSA car cette dernière a un fonctionnement différent de la plupart des cartes réseau. La carte OSA possède sa propre implémentation de couche réseau, (sans aucun rapport avec Ethernet), qui est présentée aux hôtes Linux et z/OS se trouvant derrière elle. En réalité, les cartes OSA ressemblent à des hôtes Ethernet-Ethernet (et non à des hôtes OSA) et les hôtes qui l'utilisent y répondent comme s'il s'agissait d'Ethernet.

La carte OSA exécute également certaines fonctions directement relatives à la couche IP (la réponse aux demandes de protocole de résolution d'adresses, par exemple) Ou encore, la carte OSA partagée achemine les paquets IP en fonction d'une adresse IP de destination, et non d'une adresse Ethernet comme un commutateur de couche 2. En pratique, la carte OSA est un segment de réseau avec une passerelle vers elle-même.

Load Balancer s'exécutant sur un hôte Linux S/390 ou zSeries peut acheminer le trafic vers des hôtes se trouvant sur la même carte OSA ou sur des hôtes Ethernet. Tous les hôtes se trouvant sur la même carte OSA partagée se trouvent effectivement sur le même segment.

Load Balancer peut effectuer un acheminement à partir d'une carte OSA partagée en raison de la nature de la passerelle OSA. Cette dernière reconnaît le port OSA qui possède l'IP de cluster. Le pont reconnaît l'adresse MAC des hôtes directement connectés au segment Ethernet. Par conséquent, Load Balancer peut effectuer un acheminement par méthode MAC sur une passerelle OSA.

Toutefois, Load Balancer ne peut pas effectuer d'acheminement vers une carte OSA partagée, notamment lorsqu'il se trouve sous une machine S/390 Linux et que le serveur dorsal se trouve sur une carte OSA différente de celle de Load Balancer. Le processus OSA du serveur dorsal annonce l'adresse MAC OSA pour l'IP de serveur, mais à l'arrivée d'un paquet avec l'adresse de destination Ethernet de l'OSA du serveur et l'IP du cluster, la carte OSA du serveur ne sait pas lequel de ses hôtes, le cas échéant, doit recevoir ce paquet. Les principes qui gouvernent l'acheminement MAC OSA-Ethernet à partir d'une carte OSA partagée ne fonctionnent pas lors des tentatives d'acheminement vers une carte OSA partagée.

Solution :

Dans les configurations de Load Balancer qui utilisent les serveurs zSeries ou S/390 dotés de cartes OSA, vous disposez de deux moyens pour remédier à l'incident décrit.

  1. Utilisation des fonctionnalités de plateforme

    Si les serveurs de la configuration Load Balancer se trouvent sur le même type de plateforme zSeries ou S/390, vous pouvez définir des connexions point à point (CTC ou IUCV) entre Load Balancer et chaque serveur. Configurez les noeuds finaux avec les adresses IP privées. La connexion point à point est réservée au trafic Load Balancer-serveur. Ajoutez ensuite les serveurs avec l'adresse IP du noeud final du serveur du tunnel. Dans cette configuration, le trafic du cluster passe par la carte OSA de Load Balancer et est acheminé via la connexion point à point, là où le serveur répond par sa propre route par défaut. La réponse utilise la carte OSA du serveur pour son émission, et il peut s'agir ou non de la même carte.

  2. Fonction GRE de Load Balancer

    Si les serveurs de la configuration Load Balancer ne se trouvent pas sur le même type de plateforme zSeries ou S/390, ou s'il n'est pas possible de définir une connexion point à point entre Load Balancer et chaque serveur, il est préférable d'utiliser la fonctionnalité GRE (Generic Routing Encapsulation) de Load Balancer, protocole permettant à Load Balancer d'effectuer un acheminement via des routeurs.

    Lors de l'utilisation de GRE, le paquet client->IP cluster est reçu par Load Balancer, encapsulé et envoyé au serveur. Au niveau du serveur, le paquet client->IP cluster d'origine est excapsulé et le serveur répond directement au client. L'avantage que présente l'utilisation de GRE est que Load Balancer visualise uniquement le trafic client-serveur, et non le trafic serveur-client. L'inconvénient est qu'elle réduit la taille de segment maximal de la connexion TCP à cause de la surcharge d'encapsulation.

    Pour configurer Load Balancer pour un acheminement avec encapsulation GRE, ajoutez les serveurs à l'aide de la commande suivante :

    dscontrol server add cluster_add:port:backend_server router
    backend_server  

    Où le routeur backend_server est valide si Load Balancer et le serveur dorsal se trouvent sur le même sous-réseau IP. Sinon, indiquez comme routeur l'adresse IP valide du tronçon suivant.

    Pour configurer les systèmes Linux afin qu'ils exécutent une excapsulation GRE native, lancez les commandes suivantes pour chaque serveur dorsal :

    modprobe ip_gre 
    ip tunnel add grelb0 mode gre ikey 3735928559 
    ip link set grelb0 up 
    ip addr add cluster_addr dev grelb0
    Remarque :
    Ne définissez pas l'adresse de cluster dans le bouclage des serveurs dorsaux. Lorsque vous utilisez des serveurs dorsaux z/OS, définissez les commandes spécifiques z/OS pour configurer les serveurs afin qu'ils réalisent l'excapsulation GRE.

Incident : Sur certaines versions de Linux, des fuites de mémoire se produisent lors de l'exécution de Dispatcher configuré avec le gestionnaire et les conseillers

Lors de l'exécution de Load Balancer configuré avec les fonctions de gestionnaire et de conseillers, des fuites de mémoire importantes peuvent se produire sur certaines versions Red Hat Linux. La fuite de mémoire Java augmente si le paramètre d'intervalle de temps défini pour le conseiller est petit.

Les versions IBM Java SDK de JVM et la bibliothèque NPTL (Native POSIX Thread Library) livrée avec certaines distributions de Linux, comme Red Hat Enterprise Linux 3.0, peuvent être à l'origine de la fuite de mémoire. La bibliothèque d'unités d'exécution étendue NPTL est livrée avec certaines distributions de systèmes Linux, telles que Red Hat Enterprise Linux 3, qui prennent en charge NPTL.

Voir le site http://www.ibm.com/developerworks/java/jdk/linux/tested.html pour les dernières informations sur les systèmes Linux et le kit IBM Java SDK livré avec ces systèmes.

Utilisez comme outil de diagnostic la commande vmstat ou ps pour détecter les fuites de mémoire.

Pour remédier à une fuite de mémoire, exécutez la commande suivante avant d'exécuter la machine Load Balancer pour désactiver la bibliothèque NPTL :

export LD_ASSUME_KERNEL=2.4.10

Incident : Sur SUSE Linux Enterprise Server 9, Dispatcher réachemine des paquets qui n'atteignent jamais le serveur dorsal

Lorsque vous utilisez la méthode d'acheminement MAC sur Suse Linux Enterprise Server 9, le rapport de Dispatcher peut indiquer un réacheminement du paquet (le nombre de paquets augmente), alors que ce dernier n'atteint jamais le serveur dorsal.

Lorsque cet incident se produit, l'un et/ou l'autre des cas suivant peut se présenter :

Cet incident peut être lié au module NAT iptables chargé. Sur SLES 9, cette version d'iptables contient une erreur possible, bien que non confirmée, entraînant un comportement étrange lors des interactions avec Dispatcher.

Solution :

Déchargez le module NAT iptables et le module de suivi des connexions.

par exemple :

# lsmod | grep ip
        iptable_filter          3072  0
        iptable_nat            22060  0
        ip_conntrack           32560  1 iptable_nat
        ip_tables              17280  2 
iptable_filter,iptable_nat
        ipv6                  236800  19
        # rmmod iptable_nat
        # rmmod ip_conntrack

Supprimez les modules dans leur ordre d'utilisation. Plus précisément, vous pouvez supprimer un module uniquement si le nombre de références (dernière colonne de la sortie lsmod) est égal à zéro. Si vous avez configuré des règles dans iptables, vous devez les supprimer. Par exemple : iptables -t nat -F.

Le module iptable_nat utilise ip_conntrack, vous devez d'abord supprimer le module iptable_nat, puis le module ip_conntrack.

Remarque :
le module se charge rien qu'en répertoriant les règles configurées dans la table correspondante (par exemple : iptables -t nat -L). N'exécutez pas cette action une fois que les modules sont supprimés.

Incident : Sous Windows, un message d'erreur lié à un conflit d'adresses IP apparaît à l'écran lors de la reprise de la haute disponibilité

Sous Windows, si vous utilisez la fonction haute disponibilité de Load Balancer en cas de reprise, les goScripts permettent de configurer l'IP cluster sur le Load Balancer actif et à annuler la configuration de l'IP cluster sur le système de secours. Si le goScript configurant l'adresse IP de cluster sur la machine active s'exécute avant celui qui annule la configuration de l'adresse IP de cluster sur la machine de secours, des incidents risquent de se produire. Un message en incrustation risque de signaler que le système a détecté un conflit d'adresses IP. Si vous exécutez la commande ipconfig \all, vous pouvez également voir éventuellement l'adresse IP 0.0.0.0 sur la machine.

Solution :

Exécutez la commande suivante pour déconfigurer manuellement l'adresse IP du cluster sur la machine principale :

dscontrol executor unconfigure clusterIP

Cette opération résout l'adresse 0.0.0.0 depuis la pile IP Windows.

Une fois que le partenaire à haute disponibilité publie l'adresse IP de cluster, exécutez la commande suivante pour ajouter manuellement le retour IP de cluster :

dscontrol executor configure clusterIP

Une fois la commande générée, vérifiez une nouvelle fois l'adresse IP de cluster sur la pile IP Windows en lançant la commande suivante :

ipconfig /all

Incident : Les iptables Linux peuvent interférer avec le routage de paquets

Les iptables Linux peuvent interférer avec l'équilibrage de charge du trafic et doivent être désactivées sur la machine Dispatcher.

Exécutez la commande suivante pour déterminer si les iptables sont chargés :

lsmod | grep ip_tables

Le résultat de la commande précédente peut être analogue à celui présenté ci-dessous :

ip_tables         22400   3
iptable_mangle,iptable_nat,iptable_filter

Lancez la commande suivante pour chaque iptable répertorié dans la sortie afin d'afficher les règles pour les tables :

iptables -t <short_name> -L

par exemple :

iptables -t mangle -L 
iptables -t nat    -L
iptables -t filter -L    

Si iptable_nat est chargé, il doit être déchargé. Comme iptable_nat est dépendant de iptable_conntrack, supprimez également iptable_conntrack. Pour décharger ces deux iptables, lancez la commande suivante :

rmmod iptable_nat iptable_conntrack

Mise à niveau de l'ensemble de fichiers Java fourni avec l'installation Load Balancer

Pendant le processus d'installation de Load Balancer, un ensemble de fichiers Java est également installé. Load Balancer est la seule application utilisant la version Java qui s'installe avec le produit. Ne procédez pas tout seul à la mise à niveau de cette version de l'ensemble de fichiers Java. En cas d'incident nécessitant une mise à niveau de l'ensemble de fichiers Java, contactez le service d'assistance IBM pour recevoir une mise à niveau officielle de l'ensemble de fichiers Java qui a été fourni avec l'installation Load Balancer.

Incident : Des connexions persistantes peuvent être supprimées lors de la reprise de la haute disponibilité

Sur les systèmes d'exploitation Microsoft Windows, les connexions persistantes peuvent être supprimées lors d'une reprise de haute disponibilité. Cet incident se produit uniquement lorsqu'un serveur co-implanté utilise la méthode d'acheminement MAC.

Lorsqu'une adresse IP de cluster est supprimée à partir de l'interface ethernet ou de interface de bouclage, toutes les connexions relatives à cette adresse IP sont publiées. Lorsque le système d'exploitation reçoit un paquet d'une connexion publiée, il envoie une réponse RST au client et la connexion est terminée.

Pour éviter de supprimer des connexions pendant une reprise de haute disponibilité, vous ne devez pas utiliser de serveur colocalisé sur les systèmes d'exploitation Windows lorsque vous utilisez la méthode de réacheminement MAC.

Résolution des incidents courants—CBR

Incident : CBR ne fonctionne pas

Cet incident se produit lorsqu'une autre application utilise l'un des ports utilisés par CBR. Pour plus de détails, voir Vérification des numéros de port CBR.

Incident : La commande cbrcontrol ou lbadmin n'a pas abouti

  1. La commande cbrcontrol renvoie : Erreur : Pas de réponse du serveur. Ou la commande lbadmin renvoie : Erreur : impossible d'accéder au serveur RMI. Ces erreurs peuvent se manifester lorsque votre machine a une pile sur "sock". Pour corriger ce problème, éditez le fichier socks.cnf pour qu'il contienne les lignes suivantes :
    EXCLUDE-MODULE java
    EXCLUDE-MODULE javaw
  2. Les consoles d'administration des interfaces Load Balancer (ligne de commande, interface graphique et assistants) communiquent avec cbrserver par appels RMI (Remote Method Invocation). Par défaut, la communication utilise trois ports : chacun étant défini dans le script de démarrage de cbrserver :

    Ceci peut être source de problèmes lorsqu'une des consoles d'administration s'exécute sur la même machine qu'un pare-feu ou passe par un pare-feu. Par exemple, lorsque vous émettez des commandes cbrcontrol alors que Load Balancer s'exécute sur la même machine qu'un pare-feu, des erreurs de type Erreur : Pas de réponse du serveur peuvent s'afficher.

    Pour éviter ce type d'incident, modifiez le fichier script cbrserver afin de définir le port qu'utilise RMI pour le pare-feu (ou autre application). Remplacez la ligne LB_RMISERVERPORT=11199 par LB_RMISERVERPORT=votrePort. Où votrePort est un autre port.

    Lorsque vous avez terminé, réexécutez la commande cbrserver et ouvrez le trafic des ports 11099, 10004, 11199 et 11100 ou du port d'adresse hôte choisi pour l'exécution de la console d'administration.

  3. Ces erreurs peuvent également se produire si vous n'avez pas encore lancé cbrserver.

Incident : Les requêtes ne sont pas équilibrées

Caching Proxy et CBR ont été lancés, mais les requêtes ne sont pas équilibrées. Cette erreur peut se produire lorsque vous démarrez Caching Proxy avant l'exécuteur. Si c'est le cas, le journal stderr de Caching Proxy contient le message d'erreur indiquant l'échec de la connexion à l'exécuteur (ndServerInit). Pour éviter cet incident, démarrez l'exécuteur avant Caching Proxy.

Incident : Sur les systèmes Solaris, la commande cbrcontrol executor start n'aboutit pas

Sur les systèmes Solaris, la commande cbrcontrol executor start renvoie le message suivant : “Erreur : l'exécuteur n'a pas été lancé". Cette erreur se produit si vous ne configurez pas les communications IPC (Inter-process Communication) pour le système de telle sorte que la taille maximale d'un segment de mémoire partagée et des ID sémaphore soit supérieure à la valeur par défaut du système d'exploitation. Pour augmenter la taille du segment de mémoire partagée et des ID sémaphore, vous devez modifier le fichier /etc/system. Pour plus d'informations sur la configuration du fichier, voir la section sur la modification des paramètres par défaut système des communications IPC (Inter-process Communication).

Incident : Erreur de syntaxe ou de configuration

Si la règle d'URL ne fonctionne pas, cela peut être dû à une erreur de syntaxe ou de configuration. Pour ce problème, vérifiez :

Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP

Sous Windows, l'interface graphique de Load Balancer peut se comporter de manière inattendue lorsque vous utilisez une carte vidéo Matrox AGP. Lorsque vous cliquez sur un bouton de la souris, un espace légèrement plus large que le pointeur de la souris peut être altéré avec inversion possible de la mise en évidence ou déplacement des images sur l'écran. Les anciennes cartes Matrox n'ont pas présenté ce type de comportement. Il n'existe pas de rectificatif pour les cartes Matrox AGP.

Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web

Lorsque vous utilisez l'administration Web à distance pour configurer Load Balancer, ne modifiez pas la taille (Réduire, Agrandir, Restaurer en bas, etc.) du navigateur Netscape dans lequel s'affiche l'interface graphique de Load Balancer. En effet, étant donné que Netscape recharge une page à chaque redimensionnement de la fenêtre du navigateur, une déconnexion de l'hôte en découle. Vous devez donc vous reconnecter à l'hôte après chaque modification de la taille de la fenêtre. Pour l'administration à distance basée sur le Web sur une plateforme Windows, utilisez Internet Explorer.

Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande

Dans une fenêtre de ligne de commande du système d'exploitation Windows, certains caractères nationaux de la famille Latin-1 sont altérés. Par exemple, la lettre "a" avec tilde s'affiche sous la forme d'un symbole pi. Pour rectifier cette erreur, vous devez modifier les propriétés de police de la fenêtre d'invite de commande. Pour modifier la police, procédez comme suit :

  1. Cliquez sur l'icône située dans l'angle supérieur gauche de la fenêtre d'invite de commande.
  2. Sélectionnez Propriétés, puis cliquez sur l'onglet Police.
  3. La police par défaut est Raster ; remplacez-la par Lucida Console, puis cliquez sur OK.

Incident : Sous HP-UX, la mémoire est insuffisante pour Java et une erreur d'unité d'exécution est générée

Certaines installations HP-UX 11i sont préconfigurées pour n'autoriser que 64 unités d'exécution par processus. Toutefois, certaines configurations Load Balancer en requièrent davantage. Pour les systèmes HP-UX, définissez les unités d'exécution par processus sur 256 au moins. Pour augmenter cette valeur, utilisez l'utilitaire "sam" pour définir le paramètre de noyau max_thread_proc. Si vous pensez avoir besoin d'un nombre d'unités d'exécution plus important, vous pouvez affecter à ce paramètre une valeur supérieure à 256.

Pour augmenter la valeur du paramètre max_thread_proc, voir la procédure d'augmentation de la valeur du paramètre max_thread_proc.

Incident : Sous Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés

Lorsque vous configurez votre adaptateur sur une machine Load Balancer, vous devez vérifier que les deux paramètres suivants sont corrects pour que le conseiller puisse fonctionner :

Voir la section sur la désactivation du déchargement des tâches pour les instructions de définition de ce paramètre.

Incident : Sur les systèmes Windows, la résolution de l'adresse IP en nom d'hôte n'est pas possible lorsque plusieurs adresses sont configurées sur un adaptateur

Sous Windows, lorsque vous configurez un adaptateur avec plusieurs adresses IP, configurez d'abord dans le registre l'adresse IP à affilier au nom d'hôte.

Load Balancer dépendant de InetAddress.getLocalHost() dans de nombreuses instances (par exemple, lbkeys create), l'attribution comme alias de plusieurs adresses IP à un même adaptateur peut être source d'incident. Pour éviter cela, entrez l'adresse IP à utiliser pour la résolution du nom d'hôte en premier dans le registre.

Pour résoudre ce problème, réorganisez les adaptateurs dans les Paramètres avancés de l'option Connexions réseau du Panneau de configuration. Par exemple :

  1. Ouvrez le Panneau de configuration.
  2. Ouvrez l'option Connexions réseau.
  3. Dans la barre de menus, sélectionnez Avancé > Paramètres avancés...
  4. Réorganisez les adaptateurs qui sont répertoriés dans le panneau Paramètres avancés.

Résolution des incidents courants—Site Selector

Incident : Site Selector ne s'exécute pas

Cet incident peut se produire lorsqu'une autre application utilise un des ports utilisés par Site Selector. Pour plus de détails, voir Vérification des numéros de port Site Selector.

Incident : Site Selector ne permet pas le trafic de façon circulaire à partir des clients Solaris

Symptôme : Le composant Site Selector n'effectue pas de demandes entrantes permutées de façon circulaire à partir des clients Solaris.

Cause possible : Les systèmes Solaris exécutent un démon de mémoire cache de service annuaire. Si ce démon est en cours d'exécution, la demande du programme de résolution suivante est traitée à partir de cette mémoire cache et non à partir du composant Site Selector ayant effectuée la demande.

Solution : Désactivez le démon de mémoire cache du service annuaire sur la machine Solaris.

Incident : La commande sscontrol ou lbadmin n'a pas abouti

  1. La commande sscontrol renvoie : Erreur : Pas de réponse du serveur. Ou la commande lbadmin renvoie : Erreur : impossible d'accéder au serveur RMI. Ces erreurs peuvent se manifester lorsque votre machine a une pile sur "sock". Pour corriger ce problème, éditez le fichier socks.cnf pour qu'il contienne les lignes suivantes :
    EXCLUDE-MODULE java
    EXCLUDE-MODULE javaw
  2. Les consoles d'administration des interfaces Load Balancer (ligne de commande, interface graphique et assistants) communiquent avec ssserver par appels RMI (Remote Method Invocation). Par défaut, la communication utilise trois ports : chacun étant défini dans le script de démarrage de ssserver :

    Ceci peut être source de problèmes lorsqu'une des consoles d'administration s'exécute sur la même machine qu'un pare-feu ou passe par un pare-feu. Par exemple, lorsque vous émettez des commandes sscontrol alors que Load Balancer s'exécute sur la même machine qu'un pare-feu, des erreurs de type Erreur : Pas de réponse du serveur peuvent s'afficher.

    Pour éviter ce type d'incident, modifiez le fichier script ssserver afin de définir le port qu'utilise RMI pour le pare-feu (ou autre application). Remplacez la ligne LB_RMISERVERPORT=10199 par LB_RMISERVERPORT=votrePort. Où votrePort est un autre port.

    Lorsque vous avez terminé, réexécutez la commande ssserver et ouvrez le trafic des ports 12099, 10004, 12199 et 12100 ou du port d'adresse hôte choisi pour l'exécution de la console d'administration.

  3. Ces erreurs peuvent également se produire si vous n'avez pas encore lancé ssserver.

Incident : Echec du démarrage de ssserver sous Windows

Site Selector doit pouvoir participer à un système DNS. Toutes les machines concernées par la configuration doivent également participer à ce système. Les systèmes Windows ne nécessitent pas toujours la présence du nom d'hôte configuré dans le système DNS. Avec Site Selector, un nom d'hôte doit être défini dans le système DNS pour que le démarrage s'effectue correctement.

Vérifiez que cet hôte est défini dans le système DNS. Modifiez le fichier ssserver.cmd et supprimez le "w" de "javaw". Vous devriez ainsi obtenir plus d'informations sur les erreurs.

Incident : Site Selector possède des chemins en double pour lequel l'équilibrage de charge ne s'effectue pas correctement

Le serveur annuaire de Site Selector n'est associé à aucune adresse sur la machine. Il répond aux demandes destinées aux adresses IP valides de la machine. Site Selector fait confiance au système d'exploitation pour l'acheminement de la réponse au client. Si la machine Site Selector comporte plusieurs cartes et que certaines d'entre elles sont connectées au même sous-réseau, il est possible que le système d'exploitation envoie la réponse au client à partir d'une adresse différente de celle de réception. Certaines applications client n'acceptent pas de réponse provenant d'une adresse différente de celle de l'envoi. Par conséquent, la résolution de nom semble ne pas aboutir.

Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP

Sous Windows, l'interface graphique de Load Balancer peut se comporter de manière inattendue lorsque vous utilisez une carte vidéo Matrox AGP. Lorsque vous cliquez sur un bouton de la souris, un espace légèrement plus large que le pointeur de la souris peut être altéré avec inversion possible de la mise en évidence ou déplacement des images sur l'écran. Les anciennes cartes Matrox n'ont pas présenté ce type de comportement. Il n'existe pas de rectificatif pour les cartes Matrox AGP.

Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web

Lorsque vous utilisez l'administration Web à distance pour configurer Load Balancer, ne modifiez pas la taille (Réduire, Agrandir, Restaurer en bas, etc.) du navigateur Netscape dans lequel s'affiche l'interface graphique de Load Balancer. En effet, étant donné que Netscape recharge une page à chaque redimensionnement de la fenêtre du navigateur, une déconnexion de l'hôte en découle. Vous devez donc vous reconnecter à l'hôte après chaque modification de la taille de la fenêtre. Pour l'administration à distance basée sur le Web sur une plateforme Windows, utilisez Internet Explorer.

Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande

Dans une fenêtre de ligne de commande du système d'exploitation Windows, certains caractères nationaux de la famille Latin-1 sont altérés. Par exemple, la lettre "a" avec tilde s'affiche sous la forme d'un symbole pi. Pour rectifier cette erreur, vous devez modifier les propriétés de police de la fenêtre d'invite de commande. Pour modifier la police, procédez comme suit :

  1. Cliquez sur l'icône située dans l'angle supérieur gauche de la fenêtre d'invite de commande.
  2. Sélectionnez Propriétés, puis cliquez sur l'onglet Police.
  3. La police par défaut est Raster ; remplacez-la par Lucida Console, puis cliquez sur OK.

Incident : Sur HP-UX, l'erreur Java out of memory/thread

Certaines installations HP-UX 11i sont préconfigurées pour n'autoriser que 64 unités d'exécution par processus. Toutefois, certaines configurations Load Balancer en requièrent davantage. Pour les systèmes HP-UX, définissez les unités d'exécution par processus sur 256 au moins. Pour augmenter cette valeur, utilisez l'utilitaire "sam" pour définir le paramètre de noyau max_thread_proc. Si vous pensez avoir besoin d'un nombre d'unités d'exécution plus important, vous pouvez affecter à ce paramètre une valeur supérieure à 256.

Pour augmenter la valeur du paramètre max_thread_proc, voir la procédure d'augmentation de la valeur du paramètre max_thread_proc.

Incident : Sous Windows, les conseillers et les cibles à contacter marquent tous les serveurs comme étant arrêtés

Lorsque vous configurez votre adaptateur sur une machine Load Balancer, vous devez vérifier que les deux paramètres suivants sont corrects pour que le conseiller puisse fonctionner :

Voir la section sur la désactivation du déchargement des tâches pour les instructions.

Résolution des incidents courants—Cisco CSS Controller

Incident : ccoserver ne démarre pas

Cet incident peut se produire lorsqu'une autre application utilise un des ports employés par le serveur ccoserver de Cisco CSS Controller. Pour obtenir plus d'informations, voir Vérification des numéros de port Cisco CSS Controller.

Incident : La commande ccocontrol ou lbadmin n'a pas abouti

  1. La commande ccocontrol renvoie : Erreur : Pas de réponse du serveur. Ou la commande lbadmin renvoie : Erreur : impossible d'accéder au serveur RMI. Ces erreurs peuvent se manifester lorsque votre machine a une pile sur "sock". Pour corriger ce problème, éditez le fichier socks.cnf pour qu'il contienne les lignes suivantes :
    EXCLUDE-MODULE java
    EXCLUDE-MODULE javaw
  2. Les consoles d'administration des interfaces Load Balancer (ligne de commande et interface graphique) communiquent avec ccoserver par appels RMI (Remote Method Invocation). Par défaut, la communication utilise trois ports : chacun étant défini dans le script de démarrage de ccoserver :

    Ceci peut être source de problèmes lorsqu'une des consoles d'administration s'exécute sur la même machine qu'un pare-feu ou passe par un pare-feu. Par exemple, lorsque vous émettez des commandes ccocontrol alors que Load Balancer s'exécute sur la même machine qu'un pare-feu, des erreurs de type Erreur : Pas de réponse du serveur peuvent s'afficher.

    Pour éviter ce type d'incident, modifiez le fichier script ccoserver afin de définir le port qu'utilise RMI pour le pare-feu (ou autre application). Remplacez la ligne CCO_RMISERVERPORT=14199 par CCO_RMISERVERPORT=votrePort. Où votrePort est un autre port.

    Lorsque vous avez terminé, réexécutez la commande ccoserver et ouvrez le trafic des ports 13099, 10004, 13199 et 13100 ou du port d'adresse hôte choisi pour l'exécution de la console d'administration.

  3. Ces erreurs peuvent également se produire si vous n'avez pas encore lancé ccoserver.

Incident : Impossible de créer un registre sur le port 13099

Cet incident se produit lorsqu'il manque une licence de produit valide. Lorsque vous tentez de lancer ccoserver, le message suivant s'affiche :

Votre licence a expiré !
Adressez-vous à votre ingénieur commercial ou à votre représentant
IBM.

Pour résoudre le problème, procédez comme suit :

  1. Si vous avez déjà essayé de lancer ccoserver, entrez ccoserver stop.
  2. Copiez votre licence en cours de validité dans le répertoire suivant :
  3. Entrez ccoserver pour lancer le serveur.

Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP

Sous Windows, l'interface graphique de Load Balancer peut se comporter de manière inattendue lorsque vous utilisez une carte vidéo Matrox AGP. Lorsque vous cliquez sur un bouton de la souris, un espace légèrement plus large que le pointeur de la souris peut être altéré avec inversion possible de la mise en évidence ou déplacement des images sur l'écran. Les anciennes cartes Matrox n'ont pas présenté ce type de comportement. Il n'existe pas de rectificatif pour les cartes Matrox AGP.

Incident : Réception d'une erreur de connexion lors de l'ajout d'un consultant

Vous pouvez être confronté à une erreur de connexion, due à des paramètres de configuration incorrects, lors de l'ajout d'un consultant. Pour résoudre l'incident :

Incident : Pondérations non actualisées sur le commutateur

Pour corriger ce problème :

Incident : La commande d'actualisation n'a pas mis à jour la configuration du consultant

Augmentez le niveau de consignation du journal du consultant, puis réexécutez la commande. Si elle échoue de nouveau, recherchez dans le journal les délais d'expirations SNMP ou autres erreurs de communication SNMP.

Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web

Lorsque vous utilisez l'administration Web à distance pour configurer Load Balancer, ne modifiez pas la taille (Réduire, Agrandir, Restaurer en bas, etc.) du navigateur Netscape dans lequel s'affiche l'interface graphique de Load Balancer. En effet, étant donné que Netscape recharge une page à chaque redimensionnement de la fenêtre du navigateur, une déconnexion de l'hôte en découle. Vous devez donc vous reconnecter à l'hôte après chaque modification de la taille de la fenêtre. Pour l'administration à distance basée sur le Web sur une plateforme Windows, utilisez Internet Explorer.

Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande

Dans une fenêtre de ligne de commande du système d'exploitation Windows, certains caractères nationaux de la famille Latin-1 sont altérés. Par exemple, la lettre "a" avec tilde s'affiche sous la forme d'un symbole pi. Pour rectifier cette erreur, vous devez modifier les propriétés de police de la fenêtre d'invite de commande. Pour modifier la police, procédez comme suit :

  1. Cliquez sur l'icône située dans l'angle supérieur gauche de la fenêtre d'invite de commande.
  2. Sélectionnez Propriétés, puis cliquez sur l'onglet Police.
  3. La police par défaut est Raster ; remplacez-la par Lucida Console, puis cliquez sur OK.

Incident : Sous HP-UX, la mémoire est insuffisante pour Java et une erreur d'unité d'exécution est générée

Certaines installations HP-UX 11i sont préconfigurées pour n'autoriser que 64 unités d'exécution par processus. Toutefois, certaines configurations Load Balancer en requièrent davantage. Pour les systèmes HP-UX, définissez les unités d'exécution par processus sur 256 au moins. Pour augmenter cette valeur, utilisez l'utilitaire "sam" pour définir le paramètre de noyau max_thread_proc. Si vous pensez avoir besoin d'un nombre d'unités d'exécution plus important, vous pouvez affecter à ce paramètre une valeur supérieure à 256.

Pour augmenter la valeur du paramètre max_thread_proc, voir la procédure d'augmentation de la valeur du paramètre max_thread_proc.

Résolution des incidents courants—Nortel Alteon Controller

Incident : nalserver ne démarre pas

Cet incident peut se produire lorsqu'une autre application utilise un des ports employés par le serveur nalserver de Nortel Alteon Controller. Pour plus d'informations, voir Vérification des numéros de port Nortel Alteon Controller.

Incident : La commande nalcontrol ou lbadmin n'a pas abouti

  1. La commande nalcontrol renvoie : Error: Server not responding. Ou la commande lbadmin renvoie : Erreur : impossible d'accéder au serveur RMI. Ces erreurs peuvent se manifester lorsque votre machine a une pile sur "sock". Pour corriger ce problème, éditez le fichier socks.cnf pour qu'il contienne les lignes suivantes :
    EXCLUDE-MODULE java
    EXCLUDE-MODULE javaw
  2. Les consoles d'administration des interfaces Load Balancer (ligne de commande et interface graphique) communiquent avec nalserver par appels RMI (Remote Method Invocation). Par défaut, la communication utilise trois ports : chacun étant défini dans le script de démarrage de nalserver :

    Ceci peut être source de problèmes lorsqu'une des consoles d'administration s'exécute sur la même machine qu'un pare-feu ou passe par un pare-feu. Par exemple, lorsque vous émettez des commandes nalcontrol alors que Load Balancer s'exécute sur la même machine qu'un pare-feu, des erreurs de type Erreur : Pas de réponse du serveur peuvent s'afficher.

    Pour éviter ce type d'incident, modifiez le fichier script nalserver afin de définir le port qu'utilise RMI pour le pare-feu (ou autre application). Remplacez la ligne NAL_RMISERVERPORT=14199 par NAL_RMISERVERPORT=votrePort. Où votrePort est un autre port.

    Lorsque vous avez terminé, réexécutez la commande nalserver et ouvrez le trafic des ports 14099, 10004, 14199 et 14100 ou du port d'adresse hôte choisi pour l'exécution de la console d'administration.

  3. Ces erreurs peuvent également se produire si vous n'avez pas encore lancé nalserver.

Incident : Impossible de créer un registre sur le port 14099

Cet incident se produit lorsqu'il manque une licence de produit valide. Lorsque vous tentez de lancer nalserver, le message suivant s'affiche :

Votre licence a expiré !
Adressez-vous à votre ingénieur commercial ou à votre représentant
IBM.

Pour résoudre le problème, procédez comme suit :

  1. Si vous avez déjà essayé de lancer nalserver, entrez nalserver stop.
  2. Copiez votre licence en cours de validité dans les
  3. Entrez nalserver pour lancer le serveur.

Incident : Sous Windows, comportement inattendu de l'interface graphique lors de l'utilisation de cartes vidéo Matrox AGP

Sous Windows, l'interface graphique de Load Balancer peut se comporter de manière inattendue lorsque vous utilisez une carte vidéo Matrox AGP. Lorsque vous cliquez sur un bouton de la souris, un espace légèrement plus large que le pointeur de la souris peut être altéré avec inversion possible de la mise en évidence ou déplacement des images sur l'écran. Les anciennes cartes Matrox n'ont pas présenté ce type de comportement. Il n'existe pas de rectificatif pour les cartes Matrox AGP.

Incident : Déconnexion de l'hôte lors du redimensionnement de la fenêtre du navigateur Netscape en cours d'administration Web

Lorsque vous utilisez l'administration Web à distance pour configurer Load Balancer, ne modifiez pas la taille (Réduire, Agrandir, Restaurer en bas, etc.) du navigateur Netscape dans lequel s'affiche l'interface graphique de Load Balancer. En effet, étant donné que Netscape recharge une page à chaque redimensionnement de la fenêtre du navigateur, une déconnexion de l'hôte en découle. Vous devez donc vous reconnecter à l'hôte après chaque modification de la taille de la fenêtre. Pour l'administration à distance basée sur le Web sur une plateforme Windows, utilisez Internet Explorer.

Incident : Réception d'une erreur de connexion lors de l'ajout d'un consultant

Vous pouvez être confronté à une erreur de connexion, due à des paramètres de configuration incorrects, lors de l'ajout d'un consultant. Pour résoudre l'incident :

Incident : Pondérations non actualisées sur le commutateur

Pour corriger ce problème :

Incident : La commande d'actualisation n'a pas mis à jour la configuration du consultant

Augmentez le niveau de consignation du journal du consultant, puis réexécutez la commande. Si elle échoue de nouveau, recherchez dans le journal les délais d'expirations SNMP ou autres erreurs de communication SNMP.

Incident : Sous Windows, des caractères nationaux Latin-1 endommagés apparaissent dans la fenêtre de la ligne de commande

Dans une fenêtre de ligne de commande du système d'exploitation Windows, certains caractères nationaux de la famille Latin-1 sont altérés. Par exemple, la lettre "a" avec tilde s'affiche sous la forme d'un symbole pi. Pour rectifier cette erreur, vous devez modifier les propriétés de police de la fenêtre d'invite de commande. Pour modifier la police, procédez comme suit :

  1. Cliquez sur l'icône située dans l'angle supérieur gauche de la fenêtre d'invite de commande.
  2. Sélectionnez Propriétés, puis cliquez sur l'onglet Police.
  3. La police par défaut est Raster ; remplacez-la par Lucida Console, puis cliquez sur OK.

Incident : Sous HP-UX, la mémoire est insuffisante pour Java et une erreur d'unité d'exécution est générée

Certaines installations HP-UX 11i sont préconfigurées pour n'autoriser que 64 unités d'exécution par processus. Toutefois, certaines configurations Load Balancer en requièrent davantage. Pour les systèmes HP-UX, définissez les unités d'exécution par processus sur 256 au moins. Pour augmenter cette valeur, utilisez l'utilitaire "sam" pour définir le paramètre de noyau max_thread_proc. Si vous pensez avoir besoin d'un nombre d'unités d'exécution plus important, vous pouvez affecter à ce paramètre une valeur supérieure à 256.

Pour augmenter la valeur du paramètre max_thread_proc, voir la procédure d'augmentation de la valeur du paramètre max_thread_proc

Résolution des incidents courants—Metric Server

Incident : IOException Metric Server sous Windows lors de l'exécution de fichiers de mesures utilisateur de format .bat or .cmd

Vous devez utiliser le nom complet des mesures enregistrées par l'utilisateur sur les postes Metric Server Windows. Par exemple, vous devez indiquer usermetric.bat, et non usermetric. Le nom usermetric est valide sur la ligne de commande, mais est inopérant lorsqu'il est employé à partir de l'environnement d'exécution. Si vous n'utilisez pas de nom complet pour les mesures, vous recevez une exception d'entrée-sortie Metric Server. Attribuez la valeur 3 à la variable LOG_LEVEL dans le fichier de commandes metricserver, puis consultez la sortie de journal. Dans cet exemple, l'exception se présente comme suit :

 ... java.io.IOException: CreateProcess: usermetric error=2

Incident : Metric Server n'indique pas la charge à la machine Load Balancer

Différentes raisons peuvent expliquer pourquoi le système Metric Server ne transmet pas les informations relatives à la charge à Load Balancer. Procédez aux vérifications suivantes pour en déterminer la cause :

Incident : Le journal de la machine Metric Server indique qu'une signature est nécessaire pour accéder à l'agent

Le journal de la machine Metric Server présente ce message d'erreur suite au transfert de fichiers de clés sur le serveur.

Cette erreur est consignée lorsque le fichier de clés ne donne pas d'autorisation avec la clé de la paire en raison d'une altération dans cette dernière. Pour remédier à ce problème, procédez comme suit :

Incident : Sur les systèmes AIX, lorsque Metric Server s'exécute dans des conditions difficiles, il est possible que le résultat de la commande ps –vg soit altéré

Lorsque Metric Server s'exécute dans des conditions difficiles sur une plateforme AIX multiprocesseur (4.3.3, 32 bits 5.1 ou 64 bits 5.1), il est possible que le résultat de la commande ps -vg soit altéré. Par exemple :

 55742 - A 88:19 42 18014398509449680
6396 32768 22 36 2.8 1.0 java -Xms

Les zones SIZE et/ou RSS de la commande ps peuvent indiquer une quantité de mémoire utilisée excessive.

Il s'agit d'un problème de noyau AIX connu. Le correctif APAR IY33804 rectifie ce problème. Ce correctif est disponible auprès du support AIX à l'adressehttp://techsupport.services.ibm.com/server/fixes ou auprès de votre revendeur AIX.

Incident : Configuration de Metric Server dans une configuration de second niveau avec équilibrage de la charge entre des machines Dispatcher haute disponibilité par Site Selector

Dans une configuration Load Balancer de second niveau, si Site Selector (premier niveau) équilibre la charge sur une paire de partenaires Dispatcher haute disponibilité (second niveau), vous devez effectuer certaines opérations pour configurer le composant Metric Server. Vous devez configurer le serveur de mesures pour qu'il écoute une nouvelle adresse IP qui lui soit réservée. Sur les deux machines Dispatcher haute disponibilité, le serveur de mesures n'est actif que sur la machine Dispatcher active.

Pour une configuration correcte, effectuez la procédure suivante :

Incident : Les scripts exécutés sur des machines Solaris dotées de plusieurs CPU génèrent des messages de console non souhaités

Lors de leur exécution sur des machines Solaris dotées de plusieurs CPU, les scripts metricserver, cpuload et memload peuvent générer des messages de console non souhaités. Ce comportement est dû à l'utilisation de la commande système VMSTAT pour collecter des statistiques sur la CPU et la mémoire à partir du noyau. Certains messages renvoyés par VMSTAT indiquent que l'état du noyau a changé. Les scripts ne peuvent pas gérer ces messages, ce qui entraîne la génération de messages de console inutiles provenant du shell.

Exemples de ces messages de la console :

/opt/ibm/edge/lb/ms/script/memload[29]: TOTAL=: erreur de syntaxe
/opt/ibm/edge/lb/ms/script/memload[31]: LOAD=4*100/0: diviser par zéro
/opt/ibm/edge/lb/ms/script/memload[29]: TOTAL=659664+: more tokens expected

Ces messages peuvent être ignorés.

Incident : Après le démarrage de Metric Server, la valeur de mesure renvoie -1

Cet incident peut résulter de la perte d'intégrité des fichiers de clés pendant le transfert vers le client.

Si vous utilisez FTP pour transférer les fichiers de clés entre la machine Load Balancer et le serveur dorsal, assurez-vous que vous utilisez le mode binaire pour placer ou récupérer les fichiers de clés dans le serveur FTP.