호스트 장애 유형

VMware vSphere^® High Availability 클러스터의 기본 호스트는 보조 호스트의 장애를 감지하는 역할을 합니다. 감지된 장애의 유형에 따라 호스트에서 실행 중인 가상 시스템을 페일오버해야 할 수 있습니다.

vSphere HA 클러스터에서는 다음 세 가지 유형의 호스트 장애가 감지됩니다.

장애. 호스트가 작동을 중지함
분리. 호스트가 네트워크 분리됨
파티션. 호스트와 기본 호스트의 네트워크 연결이 끊김

기본 호스트는 클러스터의 보조 호스트가 작동하는지 모니터링합니다. 이 통신은 매초 네트워크 하트비트를 교환하여 수행됩니다. 기본 호스트가 보조 호스트로부터 하트비트 수신을 중지하면 호스트에 장애가 발생한 것으로 선언하기 전에 호스트 작동 여부를 검사합니다. 기본 호스트가 수행하는 작동 여부 검사는 보조 호스트가 데이터스토어 중 하나와 하트비트를 교환하고 있는지 확인하는 것입니다. 데이터스토어 하트비트의 내용을 참조하십시오. 또한 기본 호스트는 호스트의 관리 IP 주소로 전송된 ICMP ping에 호스트가 응답하는지 여부도 확인합니다.

기본 호스트가 보조 호스트의 에이전트와 직접 통신할 수 없는 경우 보조 호스트는 ICMP ping에 응답하지 않습니다. 에이전트가 하트비트를 발행하지 않으면 장애가 발생한 것으로 간주됩니다. 그러면 호스트의 가상 시스템이 대체 호스트에서 다시 시작됩니다. 이러한 보조 호스트가 데이터스토어와 하트비트를 교환하고 있으면 기본 호스트는 보조 호스트가 네트워크 파티션에 있거나 네트워크 분리된 것으로 가정합니다. 따라서 기본 호스트는 호스트와 해당 가상 시스템을 계속 모니터링합니다. 네트워크 파티션의 내용을 참조하십시오.

호스트 네트워크 분리는 호스트가 실행 중이기는 하지만 관리 네트워크에서 vSphere HA 에이전트의 트래픽을 더 이상 인식할 수 없는 경우에 발생합니다. 호스트가 이 트래픽을 인식하지 못하면 클러스터 분리 주소에 대한 ping을 시도합니다. 이 ping도 실패하면 호스트는 네트워크에서 분리된 것으로 선언합니다.

기본 호스트는 분리된 호스트에서 실행 중인 가상 시스템을 모니터링합니다. 기본 호스트가 VM의 전원 꺼짐을 발견한 경우 기본 호스트가 VM을 호스팅하고 있다면 해당 VM을 다시 시작합니다.

참고: 네트워크 인프라가 충분히 이중화되어 있고 최소 하나의 네트워크 경로를 항상 사용할 수 있다면 호스트 네트워크 분리는 거의 발생하지 않습니다.

Proactive HA 실패

Proactive HA 실패는 호스트 구성 요소가 실패할 때 발생하며, 이로 인해 이중화 손실 또는 심각하지 않은 오류가 발생할 수 있습니다. 하지만 호스트에 상주하는 VM의 기능 동작은 아직 영향을 받지 않습니다. 예를 들어 호스트의 전원 공급 장치에 장애가 발생했지만 다른 전원 공급 장치를 사용할 수 있다면 이것은 Proactive HA 실패입니다.

Proactive HA 실패가 발생하는 경우 vSphere Client의 vSphere 가용성 섹션에서 수행되는 업데이트 적용 작업을 자동화할 수 있습니다. 영향을 받는 호스트의 VM을 다른 호스트로 옮길 수 있고 영향을 받는 호스트를 차단 모드 또는 유지 보수 모드로 설정합니다.

참고: Proactive HA 실패 모니터링이 작동하려면 클러스터에서 vSphere DRS를 사용해야 합니다.