![[AIX Solaris HP-UX Linux Windows]](../images/dist.gif)
![[z/OS]](../images/ngzos.gif)
Health Management
Com o monitoramento de funcionamento e o subsistema de gerenciamento, é possível utilizar uma abordagem orientada a política para monitorar o ambiente do servidor de aplicativos e agir quando determinados critérios são descobertos.
Subsistema de Gerenciamento e Monitoramento de Funcionamento
O subsistema de gerenciamento de funcionamento monitora continuamente o estado dos servidores e o trabalho que é executado pelos servidores em seu ambiente. O subsistema de gerenciamento de funcionamento consiste em dois elementos principais: o controlador de funcionamento e as políticas de funcionamento.
O controlador de funcionamento é o gerenciador autônomo que controla o monitoramento de funcionamento e o subsistema de gerenciamento e atua nas políticas de funcionamento para assegurar a existência de determinadas condições. O controlador de funcionamento é um recurso distribuído gerenciado pelo gerenciador de alta disponibilidade e existe dentro de todos os processos de agente do nó e gerenciador de implementação. O controlador de funcionamento fica ativo em um desses processos. Se o processo ativo falhar, ele poderá tornar-se ativo em outro processo de agente de nó ou de gerenciador de implementação.
O controlador de funcionamento é executado em um ciclo de controle. A duração do ciclo de controle define a quantidade de tempo entre verificações de ambiente iniciadas pelo controlador de funcionamento. No final do ciclo de controle, o controlador de funcionamento verifica o ambiente e gera tarefas de tempo de execução para resolver quaisquer violações nas condições de funcionamento.
Você define as políticas de funcionamento que incluem as condições de funcionamento que deseja monitorar em seu ambiente e as ações de funcionamento a serem executadas, se essas condições não forem atendidas.
Você pode desativar ou ativar o gerenciamento de funcionamento utilizando o controlador de funcionamento, enquanto ainda há várias políticas de funcionamento definidas no sistema. Você pode limitar a frequência de reinício do servidor ou proibir as reinicializações durante determinados períodos.
O subsistema de gerenciamento de funcionamento funciona quando o Intelligent Management está no modo operacional automático ou supervisionado. Quando o modo de reação da política está configurado como automático, o sistema de gerenciamento de funcionamento executa uma ação ao detectar uma violação da política de funcionamento. No modo supervisionado, o sistema de gerenciamento de funcionamento cria uma tarefa do tempo de execução que oferece uma ou mais reações. O administrador do sistema pode aprovar ou recusar as ações propostas.
Condições de Funcionamento
- Condição baseada em idade
- Controla a quantidade de tempo que o servidor está em execução. Se o tempo exceder o limite definido, as ações de funcionamento serão executadas.
- Condição de tempo limite excessivo do pedido
- Especifica uma porcentagem de pedidos de HTTP que podem atingir o tempo limite. Se a porcentagem de solicitações exceder o v alordefinido, as ações de funcionamento serão executadas. O valor de tempo limite depende da configuração do seu ambiente. Para obter informações adicionais sobre a condição de funcionamento de tempo limite excessivo da solicitação, consulte o valor de tempo limite alvo da política de funcionamento de tempo limite excessivo da solicitação.
- Condição de tempo de resposta excessivo
- Controla a quantidade de tempo que decorre até que os pedidos sejam concluídos. Se o tempo exceder o limite de tempo de resposta definido, as ações de funcionamento serão executadas.Atenção: Quaisquer solicitações que excederem o conjunto de limites de tempo limite não serão incluídas nos cálculos de tempos de resposta excessivos. Por exemplo, se o valor de tempo limite padrão de 60 segundos estiver em vigor, quaisquer solicitações que excederem esse limite e tempo limite não serão incluídas nos cálculos para tempo de resposta excessivo. Essa restrição se aplicará mesmo se você não tiver a condição de funcionamento do tempo limite excessivo de solicitação definido em seu ambiente.
- Condição da memória: uso excessivo de memória
- Controla o uso da memória para um membro. Quando o uso de memória excede uma porcentagem do tamanho de heap por um tempo especificado, as ações de funcionamento são executadas para corrigir esta situação.
- Condição da memória: fuga de memória
- Controla tendências descendentes consistentes na memória livre que está disponível para um servidor no heap Java™. Quando o heap Java se aproximar do tamanho máximo configurado, é possível executar dumps do heap ou reinicializações de servidor.
- Condição de drenagem em excesso
- Controla solicitações que possuem um tempo de resposta diminuído significativamente. Esta política conta com a detecção do ponto de mudança sobre dados da série de tempo fornecidos.
- Condição da carga de trabalho
- Especifica vários pedidos que são atendidos antes dos membros da política serem reiniciados para esvaziar os dados em cache e de memória.
- Condição porcentagem de coleta de lixo
- Monitora uma Java virtual machine (JVM) ou conjunto de JVM’s para determinar se elas gastam mais que uma porcentagem definida de tempo na coleta de lixo durante um período de tempo especificado.
Com essas condições de política de funcionamento predefinidas, foram executadas ações para otimizar a distribuição dos dados necessários, minimizar o impacto do monitoramento e aplicar a política de funcionamento em seu ambiente.
Você também pode definir condições customizadas para sua política de funcionamento se as condições de funcionamento predefinidas não se adequarem a suas necessidades. Defina condições customizadas como uma sub-expressão testada em comparação com as métricas de seu ambiente. Ao definir uma condição customizada, considere o custo de se coletar dados, analisá-los e, se necessário, aplicar a política de funcionamento. Esse custo pode aumentar dependendo da quantidade de tráfego e do número de servidores em sua rede. Analise o desempenho das condições de funcionamento customizadas antes de utilizá-las em produção.PMIMetric_FromServerStart$systemModule$cpuUtilization > 90L
Ações de Funcionamento
As ações de funcionamento definem o processo a ser utilizado quando uma condição de funcionamento não é atendida. Dependendo das condições que você definir as ações poderão variar. A tabela a seguir lista as ações de funcionamento suportadas em vários ambientes do servidor:
Ação de funcionamento | Servidores de aplicativos WebSphere executados na mesma célula do Intelligent Management | Outros servidores de middleware (incluindo servidores de aplicativos WebSphere externos) |
---|---|---|
Reinicializar o servidor | Suportado | Suportado |
Obter dumps de encadeamento | Suportado | Não-suportado |
Obter dumps do heap Java virtual machine (JVM) | Suportado para os servidores executados no Kit de Desenvolvimento de Software IBM® | Não-suportado |
Colocar o servidor no modo de manutenção | Suportado | Suportado |
Colocar o servidor no modo de manutenção e dividir a afinidade de pedido HTTP e SIP para o servidor | Suportado | Suportado |
Tirar o servidor do modo de manutenção | Suportado | Suportado |
Gerar um trap do Protocolo Simples de Gerenciamento de Rede (SNMP) | Suportado | Suportado |
- Reiniciar no local (parar o servidor, iniciar o servidor) Essa reinicialização sempre ocorre quando um cluster dinâmico está no modo manual.
- Iniciar uma instância do servidor em outro nó e parar a problemática.
- Parar somente o servidor problemático, assumindo que as instâncias de aplicativo restantes podem satisfazer a demanda.
Você também pode definir uma ação customizada. Com uma ação customizada, você define um arquivo executável para ser executado quando a condição de funcionamento for violada. Você deve definir ações customizadas antes de criar a política de funcionamento que contém as ações customizadas.
Destinos de Política de Funcionamento
Os destinos da política de funcionamento podem ser um único servidor, cada um dos servidores de um cluster ou cluster dinâmico, o On Demand Router (ODR) ou cada um dos servidores de uma célula. Você pode definir várias políticas de funcionamento para monitorar o mesmo conjunto de servidores.
Se você estiver utilizando as condições de funcionamento predefinidas, o suporte varia dependendo do tipo de servidor. Alguns servidores de middleware não suportam todos os tipos de política. A tabela a seguir resume o suporte de política de funcionamento, por tipo de servidor:Política de funcionamento predefinida | Servidores de aplicativos WebSphere executados na mesma célula do Intelligent Management | Outros servidores de middleware (incluindo servidores de aplicativos WebSphere externos) |
---|---|---|
Política baseada em duração | Suportado | Suportado |
Política de carga de trabalho | Suportado | Suportado |
Detecção de fuga de memória | Suportado | Não-suportado |
Uso de memória excessivo | Suportado | Suportado para servidores WebSphere Application Server Community Edition. Não suportado para outros tipos de servidores de middleware. |
Tempo limite de pedido excessivo | Suportado | Suportado para outros servidores de middleware aos quais o ODR roteia pedidos. |
Tempo de resposta excessivo | Suportado | Suportado |
Detecção de dreno em excesso | Suportado | Suportado |
Porcentagem de coleta de lixo | Suportado | Não-suportado |
Políticas de Funcionamento Padrão
Você pode criar políticas de funcionamento padrão utilizando as condições de funcionamento predefinidas instaladas com o produto.
Para criar uma política de funcionamento padrão, clique em
e selecione uma das condições de funcionamento predefinidas.- Fuga de memória padrão: Nível de detecção padrão. A política de funcionamento de fuga de memória padrão usa a função do orientador de desempenho. O orientador de desempenho é ativado quando essa política for ativada. Para desativar o orientador de desempenho, remover essa política de funcionamento ou limite a associação da política de funcionamento. Para preservar a política de funcionamento para uso futuro, mantenha a política de fuga de memória padrão, mas remova todos os membros. Para alterar os membros, clique em . É possível editar as associações de política de funcionamento incluindo e removendo membros da política.
- Uso de memória excessivo padrão: Configurado como 95 por cento do tamanho de heap da JVM por 15 minutos.
- Tempo limite de pedido excessivo padrão: Configurado como 5 por cento dos pedidos atingindo o tempo limite.
- Tempo de resposta excessivo padrão: Configurado para 120 segundos.
- Dreno em excesso padrão: Nível de detecção padrão.
- Porcentagem de coleta de lixo: Configurada como 10 porcento. O tempo de amostra padrão é 2 minutos.
Para visualizar as recomendações feitas pelas políticas de funcionamento padrão e tomar ações com base nessas recomendações, clique em
.