[AIX Solaris HP-UX Linux Windows][z/OS]

Health Management

Com o monitoramento de funcionamento e o subsistema de gerenciamento, é possível utilizar uma abordagem orientada a política para monitorar o ambiente do servidor de aplicativos e agir quando determinados critérios são descobertos.

Subsistema de Gerenciamento e Monitoramento de Funcionamento

O subsistema de gerenciamento de funcionamento monitora continuamente o estado dos servidores e o trabalho que é executado pelos servidores em seu ambiente. O subsistema de gerenciamento de funcionamento consiste em dois elementos principais: o controlador de funcionamento e as políticas de funcionamento.

O controlador de funcionamento é o gerenciador autônomo que controla o monitoramento de funcionamento e o subsistema de gerenciamento e atua nas políticas de funcionamento para assegurar a existência de determinadas condições. O controlador de funcionamento é um recurso distribuído gerenciado pelo gerenciador de alta disponibilidade e existe dentro de todos os processos de agente do nó e gerenciador de implementação. O controlador de funcionamento fica ativo em um desses processos. Se o processo ativo falhar, ele poderá tornar-se ativo em outro processo de agente de nó ou de gerenciador de implementação.

O controlador de funcionamento é executado em um ciclo de controle. A duração do ciclo de controle define a quantidade de tempo entre verificações de ambiente iniciadas pelo controlador de funcionamento. No final do ciclo de controle, o controlador de funcionamento verifica o ambiente e gera tarefas de tempo de execução para resolver quaisquer violações nas condições de funcionamento.

Você define as políticas de funcionamento que incluem as condições de funcionamento que deseja monitorar em seu ambiente e as ações de funcionamento a serem executadas, se essas condições não forem atendidas.

Você pode desativar ou ativar o gerenciamento de funcionamento utilizando o controlador de funcionamento, enquanto ainda há várias políticas de funcionamento definidas no sistema. Você pode limitar a frequência de reinício do servidor ou proibir as reinicializações durante determinados períodos.

O subsistema de gerenciamento de funcionamento funciona quando o Intelligent Management está no modo operacional automático ou supervisionado. Quando o modo de reação da política está configurado como automático, o sistema de gerenciamento de funcionamento executa uma ação ao detectar uma violação da política de funcionamento. No modo supervisionado, o sistema de gerenciamento de funcionamento cria uma tarefa do tempo de execução que oferece uma ou mais reações. O administrador do sistema pode aprovar ou recusar as ações propostas.

Condições de Funcionamento

As condições de funcionamento definem as variáveis que você deseja monitorar em seu ambiente. Existem várias categorias de condições da política de funcionamento. Você pode escolher a partir das seguintes condições de funcionamento predefinidas:
Condição baseada em idade
Controla a quantidade de tempo que o servidor está em execução. Se o tempo exceder o limite definido, as ações de funcionamento serão executadas.
Condição de tempo limite excessivo do pedido
Especifica uma porcentagem de pedidos de HTTP que podem atingir o tempo limite. Se a porcentagem de solicitações exceder o v alordefinido, as ações de funcionamento serão executadas. O valor de tempo limite depende da configuração do seu ambiente. Para obter informações adicionais sobre a condição de funcionamento de tempo limite excessivo da solicitação, consulte o valor de tempo limite alvo da política de funcionamento de tempo limite excessivo da solicitação.
Condição de tempo de resposta excessivo
Controla a quantidade de tempo que decorre até que os pedidos sejam concluídos. Se o tempo exceder o limite de tempo de resposta definido, as ações de funcionamento serão executadas.
Atenção: Quaisquer solicitações que excederem o conjunto de limites de tempo limite não serão incluídas nos cálculos de tempos de resposta excessivos. Por exemplo, se o valor de tempo limite padrão de 60 segundos estiver em vigor, quaisquer solicitações que excederem esse limite e tempo limite não serão incluídas nos cálculos para tempo de resposta excessivo. Essa restrição se aplicará mesmo se você não tiver a condição de funcionamento do tempo limite excessivo de solicitação definido em seu ambiente.
Condição da memória: uso excessivo de memória
Controla o uso da memória para um membro. Quando o uso de memória excede uma porcentagem do tamanho de heap por um tempo especificado, as ações de funcionamento são executadas para corrigir esta situação.
Condição da memória: fuga de memória
Controla tendências descendentes consistentes na memória livre que está disponível para um servidor no heap Java™. Quando o heap Java se aproximar do tamanho máximo configurado, é possível executar dumps do heap ou reinicializações de servidor.
Condição de drenagem em excesso
Controla solicitações que possuem um tempo de resposta diminuído significativamente. Esta política conta com a detecção do ponto de mudança sobre dados da série de tempo fornecidos.
Condição da carga de trabalho
Especifica vários pedidos que são atendidos antes dos membros da política serem reiniciados para esvaziar os dados em cache e de memória.
Condição porcentagem de coleta de lixo
Monitora uma Java virtual machine (JVM) ou conjunto de JVM’s para determinar se elas gastam mais que uma porcentagem definida de tempo na coleta de lixo durante um período de tempo especificado.
Para obter informações adicionais sobre essas condições, clique no ícone da ajuda no painel Definir propriedades gerais da política de funcionamento no console administrativo.

Com essas condições de política de funcionamento predefinidas, foram executadas ações para otimizar a distribuição dos dados necessários, minimizar o impacto do monitoramento e aplicar a política de funcionamento em seu ambiente.

Você também pode definir condições customizadas para sua política de funcionamento se as condições de funcionamento predefinidas não se adequarem a suas necessidades. Defina condições customizadas como uma sub-expressão testada em comparação com as métricas de seu ambiente. Ao definir uma condição customizada, considere o custo de se coletar dados, analisá-los e, se necessário, aplicar a política de funcionamento. Esse custo pode aumentar dependendo da quantidade de tráfego e do número de servidores em sua rede. Analise o desempenho das condições de funcionamento customizadas antes de utilizá-las em produção.
Exemplo:
PMIMetric_FromServerStart$systemModule$cpuUtilization  >  90L

Ações de Funcionamento

As ações de funcionamento definem o processo a ser utilizado quando uma condição de funcionamento não é atendida. Dependendo das condições que você definir as ações poderão variar. A tabela a seguir lista as ações de funcionamento suportadas em vários ambientes do servidor:

Tabela 1. Suporte Predefinido de Ação de Funcionamento para Diferentes Tipos de Servidores
Ação de funcionamento Servidores de aplicativos WebSphere executados na mesma célula do Intelligent Management Outros servidores de middleware (incluindo servidores de aplicativos WebSphere externos)
Reinicializar o servidor Suportado Suportado
Obter dumps de encadeamento Suportado Não-suportado
Obter dumps do heap Java virtual machine (JVM) Suportado para os servidores executados no Kit de Desenvolvimento de Software IBM® Não-suportado
Colocar o servidor no modo de manutenção Suportado Suportado
Colocar o servidor no modo de manutenção e dividir a afinidade de pedido HTTP e SIP para o servidor Suportado Suportado
Tirar o servidor do modo de manutenção Suportado Suportado
Gerar um trap do Protocolo Simples de Gerenciamento de Rede (SNMP) Suportado Suportado
Nota: Em um cluster dinâmico, uma reinicialização pode ter uma entre várias formas:
  • Reiniciar no local (parar o servidor, iniciar o servidor) Essa reinicialização sempre ocorre quando um cluster dinâmico está no modo manual.
  • Iniciar uma instância do servidor em outro nó e parar a problemática.
  • Parar somente o servidor problemático, assumindo que as instâncias de aplicativo restantes podem satisfazer a demanda.

Você também pode definir uma ação customizada. Com uma ação customizada, você define um arquivo executável para ser executado quando a condição de funcionamento for violada. Você deve definir ações customizadas antes de criar a política de funcionamento que contém as ações customizadas.

Destinos de Política de Funcionamento

Os destinos da política de funcionamento podem ser um único servidor, cada um dos servidores de um cluster ou cluster dinâmico, o On Demand Router (ODR) ou cada um dos servidores de uma célula. Você pode definir várias políticas de funcionamento para monitorar o mesmo conjunto de servidores.

Se você estiver utilizando as condições de funcionamento predefinidas, o suporte varia dependendo do tipo de servidor. Alguns servidores de middleware não suportam todos os tipos de política. A tabela a seguir resume o suporte de política de funcionamento, por tipo de servidor:
Tabela 2. Suporte de Política de Funcionamento para Diferentes Tipos de Servidor
Política de funcionamento predefinida Servidores de aplicativos WebSphere executados na mesma célula do Intelligent Management Outros servidores de middleware (incluindo servidores de aplicativos WebSphere externos)
Política baseada em duração Suportado Suportado
Política de carga de trabalho Suportado Suportado
Detecção de fuga de memória Suportado Não-suportado
Uso de memória excessivo Suportado Suportado para servidores WebSphere Application Server Community Edition. Não suportado para outros tipos de servidores de middleware.
Tempo limite de pedido excessivo Suportado Suportado para outros servidores de middleware aos quais o ODR roteia pedidos.
Tempo de resposta excessivo Suportado Suportado
Detecção de dreno em excesso Suportado Suportado
Porcentagem de coleta de lixo Suportado Não-suportado

Políticas de Funcionamento Padrão

Você pode criar políticas de funcionamento padrão utilizando as condições de funcionamento predefinidas instaladas com o produto.

Para criar uma política de funcionamento padrão, clique em Políticas Operacionais > Políticas de Funcionamento > Novo e selecione uma das condições de funcionamento predefinidas.

Como as políticas de funcionamento padrão monitoram cada servidor no modo supervisionado, essas políticas podem ser utilizadas para evitar problemas de funcionamento. Para além das políticas padrão, você pode definir políticas com configurações mais detalhadas ou operação no modo automatizado para determinados servidores ou coleções de servidores. A lista a seguir mostra o padrão em toda a célula de políticas que você pode criar utilizando as condições de funcionamento predefinidas:
  • Fuga de memória padrão: Nível de detecção padrão. A política de funcionamento de fuga de memória padrão usa a função do orientador de desempenho. O orientador de desempenho é ativado quando essa política for ativada. Para desativar o orientador de desempenho, remover essa política de funcionamento ou limite a associação da política de funcionamento. Para preservar a política de funcionamento para uso futuro, mantenha a política de fuga de memória padrão, mas remova todos os membros. Para alterar os membros, clique em Políticas Operacionais > Políticas de Funcionamento > Default_Memory_Leak. É possível editar as associações de política de funcionamento incluindo e removendo membros da política.
  • Uso de memória excessivo padrão: Configurado como 95 por cento do tamanho de heap da JVM por 15 minutos.
  • Tempo limite de pedido excessivo padrão: Configurado como 5 por cento dos pedidos atingindo o tempo limite.
  • Tempo de resposta excessivo padrão: Configurado para 120 segundos.
  • Dreno em excesso padrão: Nível de detecção padrão.
  • Porcentagem de coleta de lixo: Configurada como 10 porcento. O tempo de amostra padrão é 2 minutos.

Para visualizar as recomendações feitas pelas políticas de funcionamento padrão e tomar ações com base nessas recomendações, clique em Administração do Sistema > Gerenciamento de Tarefas > Tarefas de Tempo de Execução.


Ícone que indica o tipo de tópico Tópico de Conceito



Ícone de registro de data e hora Última atualização: last_date
http://www14.software.ibm.com/webapp/wsbroker/redirect?version=cord&product=was-nd-mp&topic=cwve_odhealth
Nome do arquivo: cwve_odhealth.html