이 시나리오에서는 기본 사이트 1이 예약된 유지 보수 또는 계획되지 않은 전원 실패로 인해 작동 중단됩니다. 모든 워크로드가 보조 사이트 2(승격된 기본 사이트)에서 실행되고 트래픽은 사이트 2의 UDLR 및 NSX Edge를 통해 라우팅됩니다. 이제 원래 기본 사이트 1은 다시 작동되고 NSX 관리자는 NSX 구성 요소를 복구하고 모든 워크로드를 기본 사이트 1로 복원하려고 합니다.
NSX 관리자는 다음과 같은 주요 목표를 충족하려고 합니다.
- 최소의 다운타임으로 사이트 2의 모든 워크로드를 원래 기본 사이트 1로 전체 페일백합니다.
- 사이트 1로의 페일백 후에 애플리케이션 IP 주소를 유지합니다.
- 사이트 1에서 모든 Edge 인터페이스 설정 및 BGP 프로토콜 구성 설정을 자동으로 복구합니다.
참고:
- 관리자는 vSphere Web Client를 사용하거나 NSX REST API를 실행하여 수동으로 페일백 작업을 수행할 수 있습니다. 또한 관리자는 페일백 동안 실행할 API가 포함된 스크립트 파일을 실행하여 일부 페일백 작업을 자동화할 수 있습니다. 이 시나리오에서는 vSphere Web Client를 사용하여 수동 페일백 단계를 설명합니다. 그러나 임의의 단계에서 CLI 또는 NSX REST API를 사용해야 하는 경우 적절한 지침이 제공됩니다.
- 이 시나리오에서 재해 복구 워크플로는 기본 NSX Manager 및 단일 보조 NSX Manager가 있는 이전에 설명한 토폴로지에만 해당됩니다. 다중 보조 NSX Manager가 있는 워크플로는 이 시나리오의 범위에 포함되지 않습니다.
사전 요구 사항
- NSX Data Center 6.4.5 이상이 사이트 1과 2 둘 다에 설치되어 있습니다.
- 사이트 1과 2의 vCenter Server가 고급 연결 모드를 사용하여 배포됩니다.
- 사이트 1 및 사이트 2에서 다음 조건이 충족됩니다.
- 애플리케이션별 보안 정책이 아닌 보안 정책(있는 경우)은 비NSX 방화벽에서 구성됩니다.
- 애플리케이션별 방화벽 규칙이 아닌 방화벽 규칙(있는 경우)은 비NSX 방화벽에서 구성됩니다.
- ECMP가 UDLR에서 사용하도록 설정되어 있고 모든 트래픽을 허용하는지 확인하기 위해 방화벽이 ESG 둘 다에서 사용하지 않도록 설정되어 있습니다.
- 사이트 2(기본으로 승격)에서는 페일백 프로세스를 시작하기 전에 범용 논리적 구성 요소가 변경되지 않습니다.
프로시저
결과
보조 사이트(사이트 2)에서 기본 사이트(사이트 1)로의 모든 NSX 구성 요소 및 워크로드에 대한 수동 페일백이 완료되었습니다.
다음에 수행할 작업
사이트 1에서 다음 단계를 수행하여 기본 사이트 1로의 페일백이 100% 완료되었는지 확인합니다.
- NSX Manager에 기본 역할이 있는지를 확인합니다.
- 제어 VM(Edge Appliance VM)이 UDLR에서 배포되는지 여부를 확인합니다.
- 모든 컨트롤러 클러스터 노드의 상태가 연결됨인지 여부를 확인합니다.
- NSX에 대해 준비된 각 호스트 클러스터에서 통신 상태 점검을 수행합니다.
- 로 이동합니다.
- 사이트 1에서 NSX Manager를 선택합니다.
- 한 번에 하나씩 클러스터를 선택하고 클러스터의 통신 채널 상태가 [UP]인지 확인합니다.
- 클러스터의 각 호스트에 대해, 호스트의 통신 채널 상태가 [UP]인지 확인합니다.
- 호스트 준비 상태가 녹색인지 여부를 확인합니다.
- UDLR 제어 VM(Edge Appliance VM)의 CLI 콘솔에 로그인하고 다음 단계를 수행합니다.
- show ip bgp neighbors 명령을 실행하여 모든 BGP 인접 네트워크가 설정되어 있는지와 해당 상태가 [UP]인지 확인합니다.
- show ip route bgp 명령을 실행하여 모든 BGP 인접 네트워크에서 모든 BGP 경로가 학습되고 있는지를 확인합니다.
사이트 1로의 전체 페일백 후에 기본 사이트 1에서 모든 워크로드가 실행되고 트래픽은 사이트 1의 UDLR 및 NSX Edge를 통해 라우팅됩니다.