HA (High Availability) riguarda l'abilità dei servizi IT di resistere a tutte le interruzioni e continuare a fornire la capacità di elaborazione in base ad un livello di servizio predefinito.
Una delle cose più importanti che è possibile eseguire per facilitare il ripristino della soluzione è quella di configurare il proprio sistema per l'HA (High Availability). Le interruzioni trattate includono sia gli eventi pianificati, come ad esempio manutenzione e backup, come gli eventi non pianificati, come errori del software errori dell'hardware, errori dell'alimentazione ed errori gravissimi. Gli ambienti organizzati in cluster sono altamente disponibili (highly available) per natura, poiché un sistema cluster viene riconfigurato quando si verifica l'errore di un nodo o di un daemon, in modo che i carichi di lavoro possano essere ridistribuiti ai restanti nodi presenti nel cluster.
Una soluzione altamente disponibile è composta da una combinazione di hardware, software e servizi che automatizzano completamente il processo di ripristino e non interrompe l'attività dell'utente. Le soluzioni HA devono fornire un punto di ripristino immediato con tempi rapidi.
In una soluzione HA, quando il server delle applicazioni rileva un problema, la transazione e i dati correlati vengono spostati automaticamente in un altro server (all'interno dello stesso centro dati o, nel caso di un errore gravissimo, su un server in un'altra ubicazione geografica). Lo spostamento della transazione e dei dati correlati in un altro server è noto come ripristino peer.