WebSphere Extended Deployment, Version 6.0.x     Sistemas Operacionais: AIX,, HP-UX, Linux, Solaris , Windows , z/OS

Visão Geral do Gerenciamento de Funcionamento

Este tópico descreve alguns problemas a serem observados quando o gerenciamento de funcionamento não estiver funcionando ou não estiver funcionando da maneira esperada.

Localizando os Logs Certos

O Health Management Controller é executado como parte do agente de nó nos nós que não são do gerenciador de implementação. É possível utilizar a função Topologia do Tempo de Execução no console administrativo para localizar a instância do Health Controller ativo. Clique em Operações de Tempo de Execução > Topologia de Tempo de Execução e procure o ícone da cruz vermelha no painel Topologia de Tempo de Execução. Se os grupos de nós estiverem configurados, selecione-os e selecione os nós não designados do segundo menu. As mensagens de registro do gerenciamento de funcionamento são exibidas no registro do agente do nó no nó com o ícone da cruz vermelha.

Configurações do Health Controller

A lista a seguir contém os problemas que são encontrados como resultado das configurações do controlador de funcionamento:
O Health Management Controller é desativado
Verifique a configuração no console administrativo clicando em Políticas Operacionais > Controladores Autônomos > Controlador de Funcionamento e selecione as guias Configuração e Tempo de Execução. O Health Management Controller fica ativado por padrão.
Nenhum ícone do controlador de funcionamento no painel Topologia de Tempo de Execução.
Determine se o Health Management Controller está em execução executando o script wsadmin checkHmmLocation.jacl, localizado no diretório install_root/bin dos nós que não são do gerenciador de implementação. Esse script exibe o local atual do controlador, se ele estiver em execução. Consulte Localizando o Controlador de Gerenciamento de Funcionamento com Scripts para obter informações adicionais. Além disso, tente a opção Forçar Atualização de Dados na página de topologia de tempo de execução para tentar e exibir o ícone do controlador de funcionamento.
As reinicializações são proibidas nesse momento.
Verifique o número de vezes de reinicializações proibidas no console administrativo clicando em Políticas Operacionais > Controladores Autônomos > Controlador de Funcionamento e selecionando o campo Reinicialização Proibida. Por padrão, nenhuma vez é proibida.
Reiniciando muito rapidamente depois da última reinicialização.
Verifique o intervalo mínimo de reinicialização no console administrativo clicando em Políticas Operacionais > Controladores Autônomos > Controlador de Funcionamento e selecionando o campo Intervalo Mínimo de Reinicialização. Não há um intervalo mínimo definido por padrão.
O ciclo de controle é muito longo.
Verifique a configuração de Duração do Ciclo de Controle no console administrativo selecionando Políticas Operacionais > Controladores Autônomos > Controlador de Funcionamento e faça ajustes, se necessário. O Health Controller verifica as violações de política periodicamente. Se a duração do ciclo de controle for muito longa, ele pode não reiniciar os servidores rápido o suficiente.
O servidor foi reiniciado X vezes consecutivamente e a condição de funcionamento continua a ser violada.
Neste caso, X indica o parâmetro de reinicialização máxima consecutiva do controlador de funcionamento. O Health Management Controller conclui que as reinicializações não estão corrigindo o problema e as desativa para o servidor. A mensagem a seguir é exibida no registro:

WXDH0011W: O servidor servername excedeu o número máximo de falhas de verificação: desativando as reinicializações.

O Health Management Controller continua a monitorar o servidor e exibe mensagens no registro se a política de funcionamento for violada:

WXDH0012W: O servidor servername com as reinicializações desativadas falhou na verificação de funcionamento.

Você pode ativar as reinicializações para o servidor executando qualquer uma das ações a seguir:
  • Desative e, em seguida, ative o Health Management Controller.
  • Ajuste a configuração de Reinicializações Máximas Consecutivas do controlador.
  • Execute o comando a seguir a partir do prompt:

    wsadmin -profile HmmControllerProcs.jacl enableServer servername

    Esse script está disponível no diretório <raiz_da_instalação>\bin nos nós que não são do gerenciador de implementação. Este script requer um gerenciador de implementação em execução.

Configurações da Política de Funcionamento

Os problemas a seguir são encontrados como resultado das configurações da política de funcionamento:
O servidor não faz parte de uma política de funcionamento.
Verifique se as associações da política de funcionamento se aplicam ao seu servidor no console administrativo clicando em Políticas Operacionais > Políticas de Funcionamento.
O modo de reação de uma política contendo o servidor é supervisionado.
Verifique o console administrativo clicando em Operações de Tempo de Execução > Gerenciamento de Tarefas > Tarefas de Tempo de Execução para encontrar pedidos de aprovação para uma ação de reinicialização para uma política no modo Supervisionado. Os servidores são reiniciados automaticamente quando você configura Automático como o modo de reação. A mensagem a seguir é gravada no registro para a condição supervisionada:


WXDH0024I: O servidor nome do servidor violou a condição de funcionamento de política de funcionamento; o modo de reação é supervisionado.

O servidor é um membro de um cluster estático e é o único membro do cluster em execução.
A política de funcionamento não desativa todos os membros de um cluster de uma só vez. Se um cluster tiver um membro de cluster, ou um membro de cluster estiver em execução, ele não será reiniciado.
O servidor é um membro de um cluster dinâmico, o número de instâncias em execução não excede o mínimo e o Placement Controller está desativado.
Verifique Número Mínimo de Instâncias Requeridas para o cluster dinâmico clicando em Servidores > Clusters Dinâmicos no console administrativo. Nesse caso, o gerenciamento de funcionamento trata o cluster dinâmico como um cluster estático, utilizando o parâmetro de número mínimo de instâncias.
O Health Management Controller não recebeu a política.
O Health Management Controller não é executado no gerenciador de implementação onde as políticas de funcionamento são criadas. Se o gerenciador de implementação for reiniciado após o Health Management Controller ser iniciado, o Health Management Controller poderá não ter a nova política.
Suavize o problema:
  1. Desativando o Health Management Controller utilizando a caixa de opções Ativar Monitoramento do Funcionamento no console administrativo.
  2. Sincronizando os repositórios de configuração com nós de backend. No console administrativo, clique em Administração do Sistema > Nós , selecione os nós a serem sincronizados e clique em Sincronizar.
  3. Reiniciando o Health Management Controller utilizando a caixa de opções Ativar Monitoramento de Funcionamento no console administrativo.
  4. Sincronizando novamente os repositórios de configuração com nós de backend.

Interações do Controlador de Posicionamento

A lista a seguir contém os problemas que são encontrados como resultado das interações do gerenciamento de funcionamento e do controlador de disposição:
O servidor é um membro de um cluster dinâmico, mas o Placement Controller não pode ser contatado.
Para membros do cluster dinâmico, o monitoramento de funcionamento verifica o controlador de posicionamento para determinar se um servidor pode ser reiniciado. Se o controlador de posicionamento estiver ativado, mas não puder ser contatado, a seguinte mensagem será exibida no registro:

WXDH1018E: Não foi possível contatar o controlador de posicionamento: {0}

Verifique se o controlador de posicionamento está em execução. Você pode localizar o controlador de posicionamento em um dos nós exibidos no painel Topologia de Tempo de Execução ou utilizando o script checkPlacementLocation.jacl.
O servidor é um membro de um cluster dinâmico, o Placement Controller está em execução e o Placement Controller instrui o gerenciamento de funcionamento a não reiniciar o servidor.
O controlador de posicionamento pode exigir que a instância do servidor permaneça em execução.
O servidor é parado, mas não iniciado.
Em um cluster dinâmico, uma reinicialização pode ter uma entre várias formas:
  • Reiniciar no local (parar o servidor, iniciar o servidor)
  • Iniciar uma instância do servidor em outro nó e parar a problemática.
  • Parar somente o servidor problemático, assumindo que as instâncias de aplicativo restantes podem satisfazer a demanda.
O controlador de posicionamento determina qual forma a reinicialização terá e, se necessário, onde iniciar a nova instância. Após uma reinicialização ser executada em um cluster dinâmico, o gerenciamento de funcionamento emitirá um pedido para o controlador de posicionamento para computar novamente sua disposição.

Configurações de Associação do Grupo de Nós

A lista a seguir contém os problemas que são encontrados como resultado das configurações do gerenciamento de funcionamento e da associação do grupo de nós:
O servidor está em um nó que está no modo de manutenção.
O gerenciamento de funcionamento não reinicia um servidor em um nó no modo de manutenção. Você pode tirar o nó do modo de manutenção clicando em Administração do Sistema > Nós > Selecionar um Nó > Cancelar Configuração de Manutenção.

Problemas de Sensor

A lista a seguir contém os problemas que são encontrados como resultado das configurações do gerenciamento de funcionamento e da associação do grupo de nós:
Nenhum dado do sensor é recebido para o servidor.
O gerenciamento de funcionamento não pode detectar uma violação de política se não receber nenhum dado dos sensores requeridos pela política. Se nenhum dado do sensor for recebido durante o ciclo de controle, o gerenciamento de funcionamento imprimirá a seguinte mensagem de registro:

WXDH3001E: Nenhum dado do sensor recebido durante o ciclo de controle do servidor nome do servidor para a classe de funcionamento healthpolicy.

Para condições de tempo de resposta, o gerenciamento de funcionamento recebe dados do ODR (On Demand Router). Nenhum dado é gerado para essas condições até que os pedidos sejam enviados através do ODR.



Related tasks
Definindo o Gerenciamento de Funcionamento

Tópico de Referência    

Termos de Uso | Feedback Última atualização: Mar 21, 2006 12:47:43 PM EST
http://publib.boulder.ibm.com/infocenter/wxdinfo/v6r0/index.jsp?topic=?topic=/com.ibm.websphere.xd.doc/info/odoe_task/rodhealthfail.html

© Copyright IBM 2005, 2006. Todos os Direitos Reservados.
Este centro de informações é desenvolvido em tecnologia Eclipse. (http://www.eclipse.org)