이 주제에서는 성능 상태 관리가 작동하지 않거나
사용자가 원하는 방식으로 작동하지 않는 경우 검토할 몇 가지
문제점을 설명합니다.
올바른 로그 찾기
성능 상태 관리 제어기는
비Deployment Manager 노드에서 Node Agent 파트로 실행됩니다. 관리 콘솔의
런타임 토폴로지 기능을 사용하여 활성 성능 상태 제어기 인스턴스를 찾을 수
있습니다. 런타임 조작 > 런타임 토폴로지를 클릭하고 런타임 토폴로지
패널에서 빨간 십자가 아이콘을 찾으십시오. 노드 그룹이 구성된 경우
두 번째 메뉴에서 노드 그룹 및 지정되지 않은 노드를 선택하십시오. 성능
상태 관리 로그 메시지는 빨간 십자가 아이콘이 있는 노드의 Node Agent 로그에
표시됩니다.
성능 상태 제어기 설정
다음 목록은 성능 상태
제어기 설정 때문에 발생하는 문제점을 포함합니다.
- 성능 상태 관리 제어기가 사용 불가능합니다.
- 관리 콘솔에서 조작 정책 > 자율 제어기 > 성능 상태 제어기를 클릭하여
설정을 확인한 후 구성 및 런타임 탭을 모두 선택하십시오. 기본적으로 성능 상태 관리 제어기는 사용 가능합니다.
- 런타임 토폴로지 패널에 성능 상태 제어기 아이콘이 없습니다.
- 비Deployment Manager 노드의 install_root/bin
디렉토리에 있는 wsadmin checkHmmLocation.jacl 스크립트를 실행하여
성능 상태 관리 제어기가 실행 중인지 판별하십시오. 실행 중인 경우 이
스크립트로 현재 제어기 위치를 표시합니다. 자세한 정보는
스크립트를 사용하여
성능 상태 관리 제어기 찾기를 참조하십시오. 또한 런타임 토폴로지
페이지에서 데이터 갱신 강제 실행 옵션을 시도하여 표시할 성능 상태
제어기 아이콘을 확보하십시오.
- 현재 재시작이 금지되었습니다.
- 관리 콘솔에서 조작 정책 > 자율 제어기 > 성능 상태 제어기를 클릭하고
재시작 금지 필드를 선택하여 재시작 금지 횟수를 확인하십시오. 기본적으로
금지 횟수는 없습니다.
- 앞서 재시작한 후로 너무 빨리 재시작되었습니다.
- 관리 콘솔에서 조작 정책 > 자율 제어기 > 성능 상태 제어기를 클릭하고
최소 재시작 간격 필드를 선택하여 최소 재시작 간격을 확인하십시오. 기본적으로
최소 간격은 정의되지 않습니다.
- 제어 주기가 너무 깁니다.
- 관리 콘솔에서 조작 정책 > 자율 제어기 > 성능 상태 제어기를 선택하여
제어 주기 길이 설정을 확인한 후 필요하면 해당 설정을 조정하십시오. 성능
상태 제어기는 정기적으로 정책 위반을 확인합니다. 해당 제어 주기 길이가 너무 길면
너무 늦게 서버를 재시작할 수도 있습니다.
- 연속적으로 서버가 X번 재시작되고 성능 상태 조건을 계속 위반합니다.
이 경우
X는 성능 상태 제어기의 최대 연속 재시작 매개변수를
표시합니다. 성능 상태 관리 제어기에서 재시작해도 문제점이 수정되지 않는다고
판단하면 서버 재시작을 사용 불가능하게 합니다. 다음 메시지가 로그에
표시됩니다.
WXDH0011W: Server servername exceeded max verification failures: disabling restarts.
성능 상태 관리 제어기는 계속 서버를 모니터하고 성능 상태
정책을 위반하는 경우 로그에 다음 메시지를
표시합니다.
WXDH0012W: Server servername with restarts disabled failed health check.
다음 조치 중 하나를 수행하여 서버 재시작을 사용 가능하게
할 수 있습니다.
성능 상태 정책 설정
성능 상태 정책 설정 때문에
다음 문제점이 발생합니다.
- 서버가 성능 상태 정책 파트에 속하지 않습니다.
- 관리 콘솔에서 조작 정책 > 성능 상태 정책을 클릭하여 성능 상태 정책 멤버쉽이
서버에 적용되었는지 확인하십시오.
- 서버를 포함하는 정책의 반응 모드가 감독 모드입니다.
- 런타임 조작 > 타스크 관리 > 런타임 타스크를 클릭하여 관리 콘솔을
확인하고 감독 모드의 정책 재시작 조치에 대한 승인 요청을 찾으십시오. 반응 모드로 자동을 설정하면 서버가 자동으로
재시작됩니다. 다음 메시지가 감독 조건에서 로그에 작성됩니다.
WXDH0024I: Server server name has violated the health policy health condition, reaction mode is supervised.
- 서버가 정적 클러스터의 구성원이고 실행 중인 유일한 클러스터 구성원입니다.
- 성능 상태 정책은 클러스터의 모든 구성원을 동시에 탈락시키지 않습니다. 클러스터에
하나의 클러스터 구성원이 있거나 하나의 클러스터 구성원이 실행 중이면 클러스터는
재시작되지 않습니다.
- 서버가 동적 클러스터의 구성원이고 실행 중인 인스턴스 수가 최소값을
초과하지 않았으며 배치 제어기가 사용 불가능합니다.
- 관리 콘솔에서 서버 > 동적 클러스터를 클릭하여 동적 클러스터에서
필요한 인스턴스의 최소 수를 확인하십시오. 이 경우 성능 상태 관리는
정적 클러스터와 마찬가지로 인스턴스의 최소 수 매개변수를 사용하여 동적
클러스터를 처리합니다.
- 성능 상태 관리 제어기에서 정책을 수신하지 않습니다.
- 성능 상태 관리 제어기가 성능 상태 정책을 작성한 Deployment Manager에서
실행되지 않습니다. 성능 상태 관리 제어기를 시작한 후 Deployment Manager를
재시작한 경우 성능 상태 관리 제어기에 새 정책이 없을 수 있습니다.
다음을
수행하여 이 문제점을 해결하십시오.
- 관리 콘솔의 성능 상태 모니터링 사용 가능 선택란을 사용하여
성능 상태 관리 제어기를 사용 불가능하게 하십시오.
- 구성 저장소를 백엔드 노드와 동기화하십시오. 관리 콘솔에서
시스템 관리 > 노드를 클릭하고 동기화할 노드를 선택한 후
동기화를 클릭하십시오.
- 관리 콘솔의 성능 상태 모니터링 사용 가능 선택란을 사용하여
성능 상태 관리 제어기를 재시작하십시오.
- 구성 저장소를 백엔드 노드와 다시 동기화하십시오.
배치 제어기 상호 작용
다음 목록은 성능 상태 관리 및
배치 제어기 상호 작용 때문에 발생하는 문제점을 포함합니다.
- 서버가 동적 클러스터의 구성원이지만 배치 제어기를 연결할 수 없습니다.
- 동적 클러스터 구성원의 경우 성능 상태 모니터링은 서버가 재시작
가능한지를 판별하기 위해 배치 제어기를 통해 이를 확인합니다. 배치 제어기가
사용 가능하지만 배치 제어기를 연결할 수 없는 경우 다음 메시지가 로그에
표시됩니다.
WXDH1018E: Could not contact the placement controller: {0}
배치
제어기가 실행 중인지 확인하십시오. checkPlacementLocation.jacl
스크립트를 사용하거나 런타임 토폴로지 패널에 표시되는 노드 중 하나에서
배치 제어기를 찾을 수 있습니다.
- 서버가 동적 클러스터의 구성원이고 배치 제어기가 실행 중이며 배치 제어기가
서버를 재시작하지 않도록 성능 상태 관리에 지시합니다.
- 배치 제어기에서 서버 인스턴스가 실행 상태로 유지되어야 할 수도 있습니다.
- 서버가 중지된 후 시작되지 않습니다.
- 동적 클러스터에서 재시작은 다음과 같은 여러 양식 중 하나를 사용할 수 있습니다.
- 정상적으로 재시작합니다(서버 중지, 서버 시작).
- 다른 노드에서 서버 인스턴스를 시작하고 실패한 서버 인스턴스를 중지합니다.
- 나머지 응용프로그램 인스턴스는 요구를 만족할 수 있다고 가정하고
실패한 서버만 중지합니다.
배치 제어기는 재시작할 양식 및 필요한 경우 새 인스턴스를 시작할
위치를 판별합니다. 동적 클러스터에서 재시작한 후 성능 상태 관리는
배치 제어기에 요청을 발행하여 해당 배치를 다시 계산합니다.
노드 그룹 멤버쉽 설정
다음 목록은 성능 상태 관리 및
노드 그룹 멤버쉽 설정 때문에 발생하는 문제점을 포함합니다.
- 서버가 유지보수 모드인 노드에 있습니다.
- 성능 상태 관리는 유지보수 모드인 노드에서 서버를 재시작하지 않습니다.
시스템 관리 > 노드 > 노드 선택 > 유지보수 설정 해제를 클릭하여
노드의 유지보수 모드를 해제할 수 있습니다.
센서 문제점
다음 목록은 성능 상태 관리 및
노드 그룹 멤버쉽 설정 때문에 발생하는 문제점을 포함합니다.
- 서버에서 센서 데이터가 수신되지 않습니다.
- 성능 상태 관리는 정책에 필요한 데이터가 센서에서 수신되지 않으면
정책 위반을 발견할 수 없습니다. 제어 주기 중 센서 데이터가 수신되지
않으면 성능 상태 관리는 다음의 로그 메시지를
인쇄합니다.
WXDH3001E: No sensor data received during control cycle from server servername for health class healthpolicy.
응답 시간
조건의 경우 성능 상태 관리는 On Demand Router에서 데이터를
수신합니다. ODR을 통해 요청을 전송할 때까지 이 조건에서 데이터는
생성되지 않습니다.