A propos des paires à haute disponibilité

Une paire à haute disponibilité est une configuration du dispositif d'intégration qui connecte deux dispositifs d'intégration physiques, ce qui leur permet de synchroniser automatiquement leurs données et d'effectuer des opérations de basculement. Les machines qui constituent la paire à haute disponibilité partagent les mêmes adresses MAC et IP, créant ainsi une identité de réseau unique.

Une paire à haute disponibilité contient un dispositif d'intégration actif et un autre dispositif d'intégration de secours. Le dispositif d'intégration qui traite activement les orchestrations est la machine active. Le dispositif d'intégration qui synchronise automatiquement les données et effectue les opérations de basculement est la machine de secours. Lorsque les machines qui constituent une paire à haute disponibilité se connectent initialement l'une à l'autre, elles se synchronisent immédiatement et déterminent quelle machine assumera le rôle actif et quelle machine endossera le rôle de veille. Pendant la synchronisation initiale, la machine active peut traiter les orchestrations. Il n'est toutefois pas possible de procéder au basculement tant que la synchronisation de la paire n'a pas complètement abouti. Une fois la paire à haute disponibilité synchronisée, elle conserve les données et les synchronise automatiquement entre les deux machines.

En cas de défaillance d'une machine active, la machine de secours lance une procédure de reprise, devient la machine active et reprend le traitement des orchestrations exactement là où l'autre machine l'avait abandonné. Le processus de reprise prend généralement moins d'une minute, mais les temps de réponse DHCP sont susceptibles de le ralentir. Pendant la procédure de reprise, la machine de secours éteint et rallume la machine active pour s'assurer que cette dernière ne poursuit pas le traitement des orchestrations. Ce n'est que lorsque la machine de secours parvient à arrêter puis à rallumer la machine active défaillante qu'elle devient la machine active. Si la machine de secours ne parvient pas arrêter puis rallumer la machine active, elle devient inactive.

Voici quelques exemples de défaillances susceptibles d'entraîner un basculement à haute disponibilité :
  • Pannes matérielles provoquées par des unités centrales, des disques durs, de la mémoire vive, des cartes mères, des interfaces réseau, des alimentations électriques et des contrôleurs RAID.
  • Echec lors de l'exécution des dispositifs d'intégration, tels que des erreurs fatales lors du traitement.
  • Echecs de communication entre les dispositifs d'intégration provoqués par des incidents liés aux interfaces réseau des ports de réplication ou aux câbles de réplication.

Lorsque la machine active perd le contact avec la machine de secours, elle arrête l'exécution des orchestrations pour empêcher la validation de données asynchrones et attend de voir si la machine de secours lance la procédure de basculement. Si la machine de secours n'éteint pas la machine active pour la rallumer, cette dernière reprend le traitement des orchestrations. Lorsque la machine de secours peut se reconnecter à la machine active, elle se synchronise avec la machine active.

La console de gestion Web (WMC) permet de surveiller l'état d'une paire à haute disponibilité et de gérer les rôles de ses dispositifs d'intégration.