ACME Enterprise사는 미국 2곳, 팰로앨토 1곳, 오스틴 1곳에 개인 데이터 센터 사이트를 두고 있습니다. 팰로앨토 사이트에서 진행되는 예약된 유지 보수 또는 예기치 않은 실패 동안, 이 회사는 해당 오스틴 사이트의 모든 애플리케이션을 복구합니다.

현재, ACME Enterprise는 다음 작업을 수동으로 수행하여 이 재해 복구를 기존 방식으로 진행합니다.
  • IP 주소 재매핑
  • 보안 정책 동기화
  • 애플리케이션 IP 주소를 사용하는 다른 서비스(예: DNS, 보안 정책 및 기타 서비스) 업데이트.

재해 복구에 대한 이러한 기존 접근 방식은 오스틴의 해당 사이트에서 복구를 100% 완료하는 데 상당한 추가 시간을 소모합니다. 최소의 다운타임으로 빠른 재해 복구를 달성하기 위해 ACME Enterprise는 다음 논리적 토폴로지 다이어그램과 같이 크로스 vCenter 환경에서 NSX Data Center 6.4.5 이상을 배포하기로 했습니다.

그림 1. 액티브-패시브 모드이고 로컬 송신을 사용하지 않도록 설정한 다중 사이트 크로스 vCenter NSX 토폴로지

2개의 사이트로 구성된 크로스 vCenter NSX 환경의 논리적 토폴로지 다이어그램.

이 토폴로지에서 팰로앨토의 사이트 1은 기본(보호된) 데이터 센터이고, 오스틴의 사이트 2는 보조(복구) 데이터 센터입니다. 각 사이트에는 자체 NSX Manager와 연결되는 단일 vCenter Server가 있습니다. 사이트 1(팰로앨토)의 NSX Manager에는 기본 NSX Manager 역할이 할당되고 사이트 2(오스틴)의 NSX Manager에는 보조 NSX Manager 역할이 할당됩니다.

ACME Enterprise는 활성 - 수동 모드로 사이트 둘 다에 크로스 vCenter NSX를 배포합니다. 팰로앨토의 사이트 1에서는 100% 애플리케이션(워크로드)이 실행되고, 오스틴의 사이트 2에서는 0%의 애플리케이션이 실행됩니다. 즉, 기본적으로 사이트 2는 수동 또는 대기 모드입니다.

두 사이트에는 모두 해당 사이트의 로컬에 해당하는 고유한 계산, Edge 및 관리 클러스터와 ESG가 있습니다. UDLR에서 로컬 송신이 사용하지 않도록 설정되어 있으므로 단일 UDLR 제어 VM만 기본 사이트에 배포됩니다. UDLR 제어 VM이 범용 전송 논리적 스위치에 연결되어 있습니다.

NSX 관리자는 사이트 1 및 사이트 2의 vCenter 도메인 2개에 걸쳐 있는 범용 개체를 생성합니다. 범용 논리적 네트워크는 범용 네트워킹 및 보안 개체(예: ULS(범용 논리적 스위치), UDLR(범용 논리적 분산 라우터) 및 UDFW(범용 분산 방화벽))를 사용합니다.

관리자는 사이트 1에서 다음 구성 작업을 수행합니다.
  • 기본 NSX Manager에서 범용 전송 영역을 생성합니다.
  • 3개의 컨트롤러 노드가 있는 범용 컨트롤러 클러스터를 배포합니다.
  • 기본 NSX Manager에서 범용 전송 영역에 로컬 계산, Edge 및 관리 클러스터를 추가합니다.
  • UDLR 제어 VM(Edge Appliance VM)에서 로컬 송신을 사용하지 않도록 설정하고, ECMP를 사용하도록 설정하고, 정상적인 다시 시작을 사용하도록 설정합니다.
  • ESG(Edge 서비스 게이트웨이) 및 UDLR 제어 VM 간에 BGP를 사용하여 동적 라우팅을 구성합니다.
  • ECMP를 사용하지 않도록 설정하고 ESG 둘 다에서 정상적인 다시 시작을 사용하도록 설정합니다.
  • ECMP가 UDLR 제어 VM에서 사용하도록 설정되어 있고 모든 트래픽을 허용되므로, ESG 둘 다에서 방화벽을 사용하지 않도록 설정합니다.

다음 다이어그램은 사이트 1의 ESG 및 UDLR에서의 업링크 및 다운링크 인터페이스 구성 샘플을 보여 줍니다.

그림 2. 사이트 1: 샘플 인터페이스 구성

사이트 1의 UDLR 및 ESG 간 샘플 인터페이스.

관리자는 사이트 2에서 다음 구성 작업을 수행합니다.
  • 보조 NSX Manager에서 범용 전송 영역에 로컬 계산, Edge 및 관리 클러스터를 추가합니다.
  • 사이트 1 ESG에 구성된 대로 ESG에 유사한 다운링크 인터페이스를 지정합니다.
  • 사이트 1 ESG에 구성된 대로 ESG에 유사한 BGP 구성을 지정합니다.
  • 사이트 1이 활성 상태인 경우 보조 사이트의 ESG 전원을 끕니다.
이제, NSX 관리자가 다음과 같은 시나리오에서 재해 복구를 달성하기 위해 수행할 수 있는 단계를 살펴보겠습니다.
  • 시나리오 1: 사이트 1에서 예약된 전체 사이트 실패
  • 시나리오 2: 사이트 1에서 예약되지 않은 전체 사이트 실패
  • 시나리오 3: 사이트 1로의 전체 페일백