A necessidade para recuperação da solução pode resultar de uma variedade de acionadores.
Recuperação da solução é o processo de retornar o sistema a um estado do qual a operação pode ser retomada. Ela inclui um conjunto de atividades que abordam a falha do sistema ou a instabilidade do sistema que pode ser acionada por circunstâncias imprevistas.
Pode ser necessário desempenhar atividades de recuperação da solução para as seguintes circunstâncias:
A finalização anormal ou inatividade do sistema pode ser causada por uma queda de energia ou falha de hardware catastrófica. Isto pode fazer com que o sistema (todas se não a maioria das JVMs) pare.
No caso de uma falha de hardware catastrófica, a solução implementada pode entrar em um estado inconsistente no reinício.
As falhas de hardware e problemas ambientais também são considerados para tempo de inatividade não planejado, embora incomparavelmente não muito quanto os outros fatores.
É possível reduzir a probabilidade de falhas de hardware e de problemas ambientais utilizando funções, tais como, recursos LPAR avançados com ajustes de recursos de autocustomização, Capacity on Demand (para evitar a sobrecarga de sistemas) e hardware redundante nos sistemas (para evitar pontos de falhas únicos).
Novos pedidos continuam fluindo para o sistema mas, exteriormente, parece que todo o processamento parou.
O sistema está responsivo e o banco de dados parece funcionar corretamente. Infelizmente, a criação da nova instância do processo está falhando.
No caso de falha de infraestrutura fundamental, a solução pode requer administração para reiniciar/reenviar transações de negócios após a resolução da falha de infraestrutura.
O sistema está funcional, mas está severamente sobrecarregado. Os tempos limite de transação são relatados e há evidência de um excesso da capacidade planejada.
Planejamento de capacidade ou ajuste de desempenho incompleto pode causar este tipo de instabilidade da solução.
Os módulos que fazem parte de uma solução desenvolvida customizada podem ter erros. Estes erros podem resultar na instabilidade da solução e em serviços com falha.
Os erros em uma solução desenvolvida customizada podem ser resultantes de várias situações, incluindo (mas não se limitando a) o seguinte:
Um design de manipulação de erros detalhado pode reduzir a instabilidade da solução.
Um defeito no produto WebSphere faz com que uma lista não processada de eventos seja processada ou limpa.