HA(고가용성)는 하드웨어 또는 소프트웨어 장애로 인해 단일 장치를 사용할 수 없게 될 때 NSX Edge 장치에서 제공하는 서비스를 사용할 수 있게 해줍니다. NSX Edge HA는 장치 간 페일오버 시 일부 서비스를 다시 시작해야 할 수 있으므로 페일오버 다운타임을 없애는 대신 최소화합니다.
예를 들어 NSX Edge HA는 상태 저장 방화벽의 연결 추적기 또는 로드 밸런서에서 보유하는 상태 저장 정보를 동기화합니다. 모든 서비스 백업을 불러오는 데 필요한 시간은 null이 아닙니다. 알려진 다시 시작 서비스가 미치는 영향의 예로는 NSX Edge가 라우터로 작동되고 있을 때 동적 라우팅의 다운타임이 0이 아닌 경우가 있습니다.
경우에 따라 두 NSX Edge HA 장치가 통신할 수 없으며 일방적으로 활성 상태로 전환하려고 합니다. 이 동작은 대기 NSX Edge를 사용할 수 없는 경우 활성 NSX Edge 서비스의 가용성을 유지하기 위한 것입니다. 다른 장치가 여전히 존재하는 경우 통신이 다시 설정되면 두 NSX Edge HA 장치가 활성 및 대기 상태를 다시 조정합니다. 이러한 조정이 완료되지 않고, 연결이 다시 설정될 때 두 장치에서 활성 상태라고 선언되면 예기치 않은 동작이 발생합니다. 분할 브레인으로 알려진 이 상태는 다음 환경 조건에서 발생합니다.
- 네트워크 파티션을 포함하는 물리적 네트워크 연결 문제
- NSX Edge의 CPU 또는 메모리 경합
- 하나 이상의 NSX Edge HA VM을 사용할 수 없게 만들 수 있는 일시적인 스토리지 문제.
예를 들어 VM을 과도하게 프로비저닝된 스토리지 밖으로 이동하면 NSX Edge HA 안정성 및 성능이 향상됩니다. 특히 대규모 야간 백업 동안 스토리지 지연 시간이 급격히 증가하면 NSX Edge HA 안정성에 영향을 줄 수 있습니다.
- 패킷 교환과 관련된 물리적 또는 가상 네트워크 어댑터의 정체.
HA 구성 엔진이 잘못된 상태가 되거나 HA 데몬이 실패하면 환경 문제 외에 분할 브레인 상태가 발생합니다.
상태 저장 고가용성
기본 NSX Edge 장치는 활성 상태이며 보조 장치는 대기 상태입니다. NSX Manager는 대기 장치를 위해 기본 장치의 구성을 복제합니다. 또는 두 장치를 수동으로 추가할 수도 있습니다. 별도 리소스 풀 및 데이터스토어에서 기본 및 보조 장치를 생성합니다. 기본 및 보조 장치를 동일한 데이터스토어에 생성하는 경우 HA 장치 쌍이 다른 ESXi 호스트에 배포될 수 있도록 클러스터에 있는 모든 호스트에서 데이터스토어를 공유해야 합니다. 데이터스토어가 로컬 스토리지인 경우에는 두 가상 시스템이 동일한 호스트에 배포됩니다.
모든 NSX Edge 서비스는 활성 장치에서 실행됩니다. 기본 장치는 대기 장치와의 하트비트를 유지하며 내부 인터페이스를 통해 서비스 업데이트를 전송합니다.
지정된 시간(기본값: 15초) 내에 기본 장치로부터 하트비트가 수신되지 않으면 기본 장치가 비활성(dead)으로 선언됩니다. 그러면 대기 장치가 활성 상태로 전환되고, 기본 장치의 인터페이스 구성을 이어받아 기본 장치에서 실행하던 NSX Edge 서비스를 시작합니다. 이와 같이 전환되면 시스템 이벤트가 설정 및 보고서의 시스템 이벤트(System Events) 탭에 표시됩니다. 로드 밸런서 및 VPN 서비스의 경우 NSX Edge와 TCP의 연결을 재설정해야 하므로 서비스가 잠시 중단되지만, 기본 및 대기 장치 간에 논리적 스위치 연결 및 방화벽 세션이 동기화됩니다. 그러나, 대기 장치가 활성화되고 서비스를 인계 받기를 기다리는 동안 전환이 이루어질 때 서비스가 중단됩니다.
NSX Edge 장치에서 장애가 발생하고 잘못된 상태가 보고되면 HA는 장애가 발생한 장치를 재활성화하기 위해 강제로 동기화합니다. 재활성화된 장치는 현재 활성 장치의 구성을 이어받고 대기 상태로 남아 있습니다. NSX Edge 장치가 비활성 상태인 경우 장치를 삭제하고 새 장치를 추가해야 합니다.
vMotion을 통해 동일한 호스트로 가상 시스템을 수동으로 이동하는 경우를 제외하고, NSX Edge는 DRS 및 vMotion을 사용한 후에도 두 HA NSX Edge 가상 시스템이 동일한 ESXi 호스트에 있지 않도록 보장합니다. 두 가상 시스템은 구성된 장치와 동일한 리소스 풀 및 데이터스토어의 vCenter에 배포됩니다. 통신할 수 있도록 NSX Edge HA의 HA 가상 시스템에 로컬 링크 IP가 할당됩니다. 관리 IP 주소를 지정하여 로컬 링크를 재정의할 수 있습니다.
Syslog 서버가 구성된 경우에는 활성 장치의 로그가 Syslog 서버로 전송됩니다.
크로스 vCenter NSX 환경의 고가용성
크로스 vCenter NSX 환경에서 NSX Edge에 대해 고가용성을 사용하도록 설정하는 경우 활성 및 대기 NSX Edge Appliance가 동일한 vCenter Server에 상주해야 합니다. NSX Edge HA 쌍의 장치 중 하나를 다른 vCenter Server로 마이그레이션하면 두 HA 장치가 더 이상 HA 쌍으로 작동하지 않으며 트래픽 중단이 발생할 수 있습니다.
vSphere HA(고가용성)
NSX Edge HA는 vSphere HA와 호환됩니다. NSX Edge 인스턴스를 실행하는 호스트가 비활성 상태가 되는 경우 NSX Edge가 대기 호스트에서 다시 시작되면 NSX Edge HA 쌍이 또 다른 페일오버를 수용할 수 있습니다.
vSphere HA가 사용되도록 설정되지 않는 경우에는 활성-대기 NSX Edge HA 쌍에서 페일오버가 한 번만 가능합니다. 하지만 두 번째 HA 쌍이 복원되기 전에 또 다른 페일오버가 발생하면 NSX Edge를 사용하지 못하게 될 수 있습니다.
vSphere HA에 대한 자세한 내용은 "vSphere 가용성" 을 참조하십시오.