1627   O cluster possui redundância insuficiente em sua conectividade do controlador.

Explicação

O cluster detectou que ele não tem redundância suficiente em suas conexões para as controladores de disco. Isso significa que outra falha na SAN pode resultar em perda de acesso para os dados do aplicativo. O ambiente SAN do cluster deve ter conexões redundantes para cada controladora de disco. Essa redundância permite a operação continuada quando houver uma falha em um dos componentes da SAN.

Para fornecer a redundância recomendada, um cluster deve ser configurado para que:

  • cada nó possa acessar cada controladora de disco por meio de duas ou mais portas diferentes do inicializador no nó.
  • cada nó possa acessar cada controladora de disco por meio de duas ou mais portas diferentes de destino do controlador. Nota: Algumas controladoras de disco fornecem apenas uma única porta de destino.
  • cada nó possa acessar cada porta de destino do controlador de disco por meio de pelo menos uma porta do inicializador no nó.

Se não houver erros de prioridade mais alta sendo relatados, este erro geralmente indica um problema com o design de SAN, um problema com o zoneamento SAN ou um problema com a controladora de disco.

Se houver erros de prioridade mais alta não corrigidos que se relacionem com à SAN ou às controladoras de disco, esses erros devem ser corrigidos antes da resolução deste erro porque eles podem indicar a razão da falta de redundância. Os códigos de erro que devem ser corrigidos primeiro são:

  • 1210 Porta FC Local excluída
  • 1230 O login foi excluído

Nota: Este erro pode ser relatado se a ação necessária, para reanalisar novos MDisks na rede Fibre Channel, não tiver sido executada após uma reconfiguração deliberada de uma controladora de disco ou depois da redefinição da zona SAN.

O código de erro 1627 é relatado para um número de IDs de erro diferentes. O ID de erro indica a área em que haja uma falta de redundância. Os dados relatados em uma entrada de log de eventos indicam onde a condição foi localizada.

O significado dos IDs de erro é mostrado abaixo. Para cada ID de erro, é fornecida a razão mais provável para a condição. Se o problema não for localizado nas áreas sugeridas, verifique a configuração e o estado de todos os componentes da SAN (comutadores, controladores, discos, cabos e clusters) para determinar onde há um único ponto de falha.

010040 Uma controladora de disco está disponível apenas a partir de uma única porta de nó.

  • Um nó detectou que ele possui apenas uma conexão com a controladora de disco exatamente por meio de uma porta do inicializador e mais de uma porta do inicializador está operacional.
  • Os dados de erro indicam o WWNN do dispositivo e o WWPN da porta conectada.
  • Um problema de zoneamento ou uma falha do hardware de conexão Fibre Channel pode causar essa condição.

010041 Uma controladora de disco está disponível a partir de uma única porta no controlador.

  • Um nó que detectou que está conectado exatamente a apenas uma porta de destino em uma controladora de disco, e mais de uma conexão de porta de destino é esperada.
  • Os dados de erro indicam o WWPN da porta da controladora de disco que está conectado.
  • Um problema de zoneamento ou uma falha do hardware de conexão Fibre Channel pode causar essa condição.

010042 Apenas uma única porta em uma controladora de disco está acessível a partir de cada nó no cluster.

  • Apenas uma única porta em uma controladora de disco está acessível a cada nó quando houver diversas portas na controladora que podem ser conectadas.
  • Os dados de erro indicam o WWPN da porta da controladora de disco que está conectado.
  • Um problema de zoneamento ou uma falha do hardware de conexão Fibre Channel pode causar essa condição.

010043 Uma controladora de disco está acessível apenas por meio de metade, ou menos, das portas das portas da controladora configuradas anteriormente.

  • Apesar da possibilidade de ainda existirem diversas portas acessíveis na controladora de disco, um componente de hardware da controladora pode ter falhado ou uma das malhas SAN falhou de forma que a configuração do sistema operacional foi reduzida a um único ponto de falha.
  • Os dados de erro indicam uma porta no controlador de disco que ainda está conectado, e também lista as portas da controladora que são esperadas mas que não estão conectadas.
  • Um problema da controladora de disco, um problema de hardware do comutador, um problema de zoneamento ou uma falha do cabo poderá causar essa condição.

010044 Uma controladora de disco não está acessível a partir de um nó.

  • Um nó detectou que não possui acesso a uma controladora de disco. A controladora ainda está acessível a partir do nó do parceiro no grupo de E/S, assim seus dados ainda estão acessíveis aos aplicativos de host.
  • Os dados de erro indicam o WWPN da controladora de disco ausente.
  • Um problema de zoneamento ou um erro de cabeamento pode causar essa condição.

010117 Um controlador de disco não está acessível a partir de um nó que tem permissão de acesso ao dispositivo pela política de site

  • Um controlador de disco não está acessível a partir de um nó que tem permissão de acesso ao dispositivo pela política de site. Se um controlador de disco tiver diversos WWNNs, o controlador de disco ainda poderá estar acessível para o nó através de um dos outros WWNNs.
  • Os dados de erro indiciam o WWNN do controlador de disco inacessível.
  • Um problema de zoneamento ou uma falha de hardware da conexão fibre channel pode causar esta condição.

Resposta do Usuário

  1. Verifique o ID de erro e os dados para obter uma descrição mais detalhada do erro.
  2. Determine se houve uma alteração intencional no zoneamento da SAN ou em uma configuração de controladora de disco que reduza o acesso do cluster à controladora de disco indicada. Se a ação tiver ocorrido, continue com a etapa 8.
  3. Utilize a GUI ou o comando da CLI lsfabric para assegurar que todos os WWPNs da controlador de disco sejam relatados como esperado.
  4. Assegure que todos os WWPNs do controlador de disco estejam adequadamente zoneados para uso pelo cluster.
  5. Verifique se há algum erro não corrigido nas controladoras de disco.
  6. Assegure que todos os cabos Fibre Channel estejam conectados às portas corretas em cada extremidade.
  7. Verifique se há falhas nos cabos e conectores Fibre Channel.
  8. Quando tiver resolvido os problemas, utilize a GUI ou o comando da CLI detectmdisk para reanalisar alterações nos MDisks na rede Fibre Channel. Nota: Não tente detectar MDisks a menos que tenha certeza de que todos os problemas tenham sido corrigidos. A detecção prematura de MDisks pode mascarar um problema.
  9. Marque o erro que você acabou de corrigir como corrigido. O cluster irá revalidar a redundância e relatar outro erro se ainda não houver redundância suficiente.
  10. Acesse MAP 5700: Verificação de reparo.

Causa Possível - unidades substituíveis em campo ou outra:

  • Nenhuma