코어 그룹 발견 및 장애 발견 프로토콜

코어 그룹 멤버가 시작될 때 다른 코어 그룹 멤버에 대한 연결은 전혀 존재하지 않습니다. 기본 발견 및 장애 발견 프로토콜 또는 다른 프로토콜 제공자에서 코어 그룹을 실행하도록 구성한 경우 발견 및 장애 발견 태스크 또는 다른 프로토콜 제공자 태스크는 프로세스 시작 프로시저의 일부로 시작됩니다. 이러한 태스크는 코어 그룹 멤버가 활성 상태인 동안 정기적으로 스케줄된 간격마다 다른 코어 그룹 멤버와의 연결을 구축하고, 이 연결을 모니터하며, 코어 그룹 멤버에 대한 연결 장애를 핸들링합니다.

기본 발견 프로토콜

참고: 이 주제는 하나 이상의 애플리케이션 서버 로그 파일을 참조합니다. 권장되는 대안은 분배 및 IBM® i 시스템에서 SystemOut.log, SystemErr.log, trace.logactivity.log 파일을 사용하는 대신 HPEL(High Performance Extensible Logging) 로그를 사용하고 인프라를 추적하도록 서버를 구성하는 것입니다. 원시 z/OS® 로깅 기능과 연계하여 HPEL을 사용할 수도 있습니다. HPEL을 사용하는 경우 서버 프로파일 바이너리 디렉토리의 LogViewer 명령행 도구를 사용하여 모든 로그에 액세스하고 정보를 추적할 수 있습니다. HPEL 사용에 대한 자세한 정보는 HPEL을 사용한 애플리케이션 문제점 해결 정보를 참조하십시오.

기본 발견 프로토콜은 코어 그룹의 다른 멤버와의 네트워크 연결을 설정합니다. 이 연결을 설정하기 위해 발견 프로토콜은 제품 구성 설정값에서 코어 그룹 멤버 및 연관된 네트워크 정보 목록을 검색합니다. 그런 다음 발견 프로토콜은 다른 모든 코어 그룹 멤버와의 네트워크 연결을 열려고 시도합니다. 정기적 간격으로, 발견 프로토콜은 연결되지 않은 멤버 세트를 다시 계산하고 해당 멤버와의 연결을 열려고 시도합니다.

다른 코어 그룹 멤버와 연결되면, 발견 프로토콜은 보기 동기화 프로토콜에 이를 알리고 이 이벤트를 다음 메시지와 유사한 정보 메시지로 SystemOut.log 파일에 기록합니다.
DCSV1032I: DCS Stack DefaultCoreGroup at Member MyCell\anzio\nodeagent:
Connected a defined member MyCell\anzioCellManager\dmgr.

연결은 다양한 이유로 언제든지 실패할 수 있습니다. 장애 발견 프로토콜은 연결 실패를 감지하고 발견 프로토콜에 알립니다. 그런 다음 발견 프로토콜은 스케줄된 다음 간격에서 해당 멤버와의 새 네트워크 연결을 열려고 시도합니다.

발견 프로토콜 태스크가 이용하는 CPU 주기 양은 중지되거나 도달할 수 없는 코어 그룹 멤버 수에 비례합니다. 발견 프로토콜 태스크가 이용하는 CPU 주기는 기본 설정에서 무시해도 됩니다.

기본 장애 발견 프로토콜

장애 발견 프로토콜은 발견 프로토콜이 설정하는 코어 그룹 네트워크 연결을 모니터합니다. 장애 발견 프로토콜이 실패한 네트워크 연결을 감지하면 보기 동기화 프로토콜과 발견 프로토콜에 장애를 보고합니다. 보기 동기화 프로토콜은 보기를 조절하여 실패한 멤버를 제외시킵니다. 발견 프로토콜은 실패한 멤버와의 네트워크 연결을 다시 설정하려고 합니다. 이 태스크는 멤버가 활성화 되는 즉시 실행됩니다.

장애 발견 프로토콜은 두 가지의 다른 메커니즘을 사용하여 실패한 멤버를 찾습니다.
기본 소켓이 닫혔으므로 닫힌 연결을 찾습니다.

코어 그룹 멤버가 관리 명령에 대한 응답으로 정상적으로 중지된 경우, 해당 멤버에 대한 코어 그룹 전송도 중지되고 전송과 연관되는 소켓도 닫힙니다. 코어 그룹 멤버가 비정상적으로 종료되면 보통 기본 운영 체제가 프로세스에서 열린 소켓을 닫고 코어 그룹 전송에 연관된 소켓도 닫습니다.

어느 유형의 종료에 대해서도, 종료된 멤버와의 열린 연결을 가지고 있는 코어 그룹 멤버에는 더 이상 연결을 사용할 수 없음을 알립니다. 소켓 닫힘 알림을 받는 코어 그룹 멤버는 종료된 멤버를 실패한 멤버로 간주합니다.

소켓 닫기 메커니즘으로 인해 실패한 멤버가 발견되면 다음 메시지가 살아 남은 멤버의 SystemOut.log 파일에 기록됩니다.
DCSV1115W: DCS Stack DefaultCoreGroup at Member anzioCell01\anzio\ServerD:
Member anzioCell01\anzio\ServerC connection  was closed. Member will  be removed from view.
DCS connection status is Discovery|Ptp, transmitter closed.

닫힌 소켓 메커니즘은 일반적으로 실패한 멤버가 발견되는 방식입니다. 기본 운영 체제에서의 TCP 설정(예: FIN_WAIT)은 소켓 닫기 이벤트가 수신되는 속도에 영향을 줍니다.

코어 그룹 멤버에서 활성 상태의 하트비트를 청취합니다.

활성 하트비트 메커니즘은 활성화 상태 지속 기능의 TCP와 유사합니다. 정기적으로 스케줄된 간격으로, 각각의 코어 그룹 멤버는 열린 모든 코어 그룹 연결에 대해 핑 패킷을 전송합니다. 패킷이 전송되는 비율 또는 주기는 하트비트 전송 기간이라고 합니다.

각 코어 그룹 멤버는 활성 상태인 각 연결이 연결의 다른 쪽 끝에 있는 코어 그룹 멤버로부터 패킷을 수신할 것으로 예상합니다. 하트비트 제한시간으로 지정된 시간 내에 활성 상태의 연결에서 받은 패킷이 없는 경우 연결의 다른 쪽 끝에 있는 멤버가 실패로 표시됩니다.

하트비트 제한시간은 여러 개의 하트비트 전송 기간의 전체 기간이어야 합니다. 또한 하트비트 제한시간은 하트비트 전송 기간의 두 배 이상이어야 합니다.

멤버가 실패한 것으로 표시되면, 다음 메시지가 오류 로그 파일로 전송됩니다.
DCSV1112W: DCS Stack DefaultCoreGroup at Member anzioCell01\anzioCellManager01\dmgr:
Suspected member anzioCell01\nettuno\ServerB because of heartbeat timeout.
Configured Timeout is 180000 milliseconds. DCS logical channel is Connected|Ptp.

활성 하트비트는 네트워크 중지로 인해 도달할 수 없는 코어 그룹 멤버를 감지하는 데 가장 유용합니다. 활성 하트비트는 일부 CPU 사용량을 차지합니다. 소모되는 CPU 사용량은 코어 그룹의 활성 멤버 수에 비례합니다. 활성 하트비트의 기본 구성은 CPU 사용에 밸런스를 유지하고 적시에 실패한 멤버를 감지하는 것입니다.

관리 콘솔 또는 wsadmin 도구를 사용하여 하트비트 전송 기간 및 하트비트 제한시간 기간을 구성할 수 있습니다. 관리 콘솔에서 이 설정값을 변경하는 방법에 대해서는 코어 그룹에 대한 장애 발견 프로토콜 구성 주제를 읽으십시오.

[IBM i][AIX Solaris HP-UX Linux Windows]

대체 프로토콜 제공자

현재, 대체 프로토콜 제공자는 IBM i 및 분산 플랫폼에 사용할 수 없습니다.

대체 프로토콜 제공자

기본 발견 프로토콜 및 장애 발견 프로토콜 대신에 다른 프로토콜 제공자를 사용하여 코어 그룹 멤버 간의 통신을 모니터하고 관리할 수 있습니다. 일반적으로 z/OS XCF(Cross-system Coupling Facility) 기반 제공자와 같이 대체 프로토콜 제공자는 기본 발견 프로토콜 및 장애 발견 프로토콜보다 더 적은 시스템 자원을 사용합니다(특히 코어 그룹 멤버가 대기 중일 때 ). 대체 프로토콜 제공자가 코어 그룹 멤버의 활성 상태 유지를 판별하는 데 사용하는 멤버 간 TCP/IP 핑을 대체 프로토콜 제공자에서는 수행하지 않으므로 일반적으로 시스템 자원을 적게 사용합니다.

[z/OS]z/OS XCF(Cross-system Coupling Facility) 기반 프로토콜 제공자를 사용하기로 결정한 경우 시작 시 서버 프로세스가 XCF 그룹에 멤버로 결합됨을 알고 있어야 합니다. XCF 그룹에는 코어 그룹의 모든 활성 멤버가 포함됩니다. XCF는 멤버가 그룹에 결합될 때마다, 서버가 종료되거나 XCF가 서버 프로세스가 종료되었다고 판별했기 때문에 멤버가 더 이상 접속할 수 없을 때마다 이 그룹의 모든 멤버에 알림을 제공합니다. 코어 그룹 멤버 간의 연결이 설정될 때마다 z/OS XCF(Cross-System Coupling Facility) 기반 프로토콜 제공자는 보기 동기화 프로토콜에 알리고 이 이벤트를 다음 메시지와 유사한 정보 메시지로 SystemOut.log 파일에 로그합니다.
DCSV1032I: DCS Stack DefaultCoreGroup at Member MyCell\anzio\nodeagent:
Connected a defined member MyCell\anzioCellManager\dmgr.
다른 프로토콜 제공자를 사용하도록 특정 코어 그룹을 다시 구성하려면 먼저 코어 그룹이 다음 요구사항을 충족하는지 확인해야 합니다. 코어 그룹이 모든 요구사항을 충족하지 않는 경우 이 코어 그룹에서 기본 발견 프로토콜 및 기본 장애 발견 프로토콜을 계속해서 사용해야 합니다.
  • 코어 그룹은 동일(homogenous)합니다. 이는 코어 그룹 프로세스가 모두 동일한 플랫폼에 상주해야 함을 의미합니다. 예를 들어, 코어 그룹은 z/OS 및 분산 처리가 혼합된 프로세스를 포함할 수 없습니다.

    [z/OS]코어 그룹에 비z/OS 프로세스가 있거나 코어 그룹이 다른 버전 레벨의 제품에 있는 멤버로 구성된 경우 이 코어 그룹에 XCF를 사용할 수 없습니다.

  • 코어 그룹 브릿지 서비스를 사용하여 코어 그룹을 다른 코어 그룹에 브릿지해야 하는 경우 이 코어 그룹에 브릿지된 모든 코어 그룹도 이 코어 그룹과 동일(homogeneous)합니다.
  • 코어 그룹의 모든 멤버는 제품 버전 7.x 이상이어야 합니다. 코어 그룹의 멤버가 버전 6.x 레벨의 제품에서 실행되는 경우 다른 프로토콜 제공자로 전환하려면 이 멤버를 버전 7.x로 업데이트해야 합니다.

주제 유형을 표시하는 아이콘 개념 주제



시간소인 아이콘 마지막 업데이트 날짜: last_date
http://www14.software.ibm.com/webapp/wsbroker/redirect?version=cord&product=was-nd-mp&topic=crun_ha_discovery
파일 이름:crun_ha_discovery.html