SASE Orchestrator DR(재해 복구) 기능은 저장된 데이터의 손실을 방지하고 시스템 또는 네트워크 장애 시 SASE Orchestrator 서비스를 재개합니다.

SASE Orchestrator DR 중에 데이터 복제 및 수동 트리거 페일오버 메커니즘으로 활성/대기 SASE Orchestrator 쌍이 설정됩니다.
  • 따라서 RTO(복구 시간 목표)는 대기 상태가 승격되도록 트리거하기 위해 운영자의 명시적 작업에 따라 다릅니다.
  • 그러나 RPO(복구 시점 목표)는 모든 구성이 즉시 복제되기 때문에 복구 시간과 관계없이 기본적으로 0입니다. 중단 중에 수집되었을 수 있는 모니터링 데이터는 대기 상태의 승격이 보류 중인 Edge 및 게이트웨이에서 캐시됩니다.
참고: DR은 필수입니다. 라이센싱 및 가격 책정의 경우 지원이 필요하면 VMware 영업 팀에 문의하십시오.

활성/대기 쌍

SASE Orchestrator DR 배포에서 두 개의 동일한 SASE Orchestrator 시스템이 활성/대기 쌍으로 구성됩니다. 운영자는 서버 중 하나에서 웹 UI를 통해 DR 준비 상태를 볼 수 있습니다. Edge 및 게이트웨이는 두 SASE Orchestrator를 모두 인식하고, 활성 SASE Orchestrator에서만 구성 변경을 수신하면서 두 시스템 모두에 DR 하트비트를 주기적으로 전송하여 두 서버에 해당 보기를 보고하고, DR 시스템 상태를 쿼리합니다. 운영자가 페일오버를 트리거하면 Edge 및 게이트웨이에 다음 DR 하트비트의 변경 내용이 통보됩니다.

DR 상태

운영자와 Edge 및 게이트웨이의 관점에서 SASE Orchestrator의 DR 상태는 다음 4가지 중 하나입니다.

DR 상태 설명
독립형(Standalone) DR이 구성되어 있지 않습니다.
액티브 기본 SASE Orchestrator 서버로 작동하는 DR이 구성되어 있습니다.
대기 비활성 복제 SASE Orchestrator 서버로 작동하는 DR이 구성되어 있습니다.
좀비(Zombie) DR이 이전에 구성되고 활성 상태였지만 이제 활성 또는 대기로 작동하지 않습니다.

런타임 작업

DR이 구성되면 대기 서버가 제한된 모드로 실행되어 DR 상태 및 DR 하트비트와 관련된 API 호출을 제외한 모든 API 호출이 차단됩니다. 운영자가 페일오버를 호출하면 대기는 독립 실행형 서버로 완전히 작동하도록 승격됩니다. 이전에 활성 상태였던 서버는 응답하며, 승격된 대기 상태에서 표시되는 경우 자동으로 좀비 상태로 전환됩니다. 좀비 상태에서 관리 구성 서비스가 차단되고 새 활성 SASE Orchestrator로 전환되지 않은 Edge 및 게이트웨이의 모든 연락처가 승격된 서버로 리디렉션됩니다.

disaster-recovery-replica-and-status

SASE Orchestrator 복제 설정

복제를 시작하려면 두 개의 설치된 SASE Orchestrator 인스턴스가 필요합니다.

  • 선택한 대기 Orchestrator는 STANDBY_CANDIDATE 상태로 전환되어 활성 서버에서 구성할 수 있게 됩니다.
  • 그런 다음, 활성 서버에는 대기 Orchestrator의 주소 및 자격 증명이 제공되며 ACTIVE_CONFIGURING 상태로 전환됩니다.
STANDBY_CONFIG_RQST가 활성에서 대기로 변경되면 두 서버가 상태 전환을 통해 동기화됩니다.
DR(재해 복구)을 설정해야 하는 두 Orchestrator는 동시에 설정되어야 합니다. SASE Orchestrator 복제를 시작하기 전에 다음 NTP 구성을 확인해야 합니다.
  • 게이트웨이 표준 시간대를 Etc/UTC로 설정해야 합니다. 다음 명령을 사용하여 NTP 표준 시간대를 확인합니다.
    vcadmin@vcg1-example:~$ cat /etc/timezone
    Etc/UTC
    vcadmin@vcg1-example:~$ 
    

    표준 시간대가 잘못된 경우 다음 명령을 사용하여 표준 시간대를 업데이트합니다.

    echo "Etc/UTC" | sudo tee /etc/timezone
    sudo dpkg-reconfigure --frontend noninteractive tzdata
    
  • NTP 오프셋은 15밀리초보다 작거나 같아야 합니다. 다음 명령을 사용하여 NTP 오프셋을 확인합니다.
    sudo ntpqvcadmin@vcg1-example:~$ sudo ntpq -p
         remote           refid      st t when poll reach   delay   offset  jitter
    ==============================================================================
    *ntp1-us1.prod.v 74.120.81.219    3 u  474 1024  377   10.171   -1.183   1.033
     ntp1-eu1-old.pr .INIT.          16 u    - 1024    0    0.000    0.000   0.000
    vcadmin@vcg1-example:~$ 
    

    오프셋이 잘못된 경우 다음 명령을 사용하여 NTP 오프셋을 업데이트합니다.

    sudo systemctl stop ntp
    sudo ntpdate <server>
    sudo systemctl start ntp
  • 기본적으로 NTP 서버 목록은 /etc/ntpd.conf 파일에 구성됩니다. DR을 설정해야 하는 Orchestrator가 기본 NTP 서버에 액세스하려면 인터넷에 연결되어 있어야 하고 Orchestrator 둘 다에 시간이 동기화되어 있는지 확인해야 합니다. 또한 고객은 환경에서 실행 중인 로컬 NTP 서버를 사용하여 시간을 동기화할 수 있습니다.

대기 Orchestrator 설정

대기 Orchestrator를 설정하려면 다음 단계를 수행합니다.

  1. 엔터프라이즈 포털의 SD-WAN 서비스에서 Orchestrator 탭을 클릭한 후 왼쪽 창에서 복제(Replication) 버튼을 클릭하여 Orchestrator 복제(Orchestrator Replication) 화면을 표시합니다.
  2. 대기(Standby)(복제 역할(Replication Role)) 라디오 버튼을 선택하여 대기 Orchestrator를 활성화합니다.
  3. 대기에 사용(Enable for Standby) 버튼을 클릭합니다.

    [대기 Orchestrator(Standby Orchestrator)] 페이지가 나타납니다.

  4. 수동 구성(manual configuration) 매개 변수를 입력하고 구성 정보 업데이트(Update configuration info) 버튼을 클릭합니다.

    대기 Orchestrator가 복제용으로 구성된 후에는 아래 지침에 따라 활성 Orchestrator를 구성합니다.

활성 Orchestrator 설정

활성 Orchestrator를 설정하려면 [복제 역할(Replication Role)]로 [활성(Active)]을 선택하고 다음을 구성합니다.

옵션 설명
복제 역할 선택(Select Replication Role) 복제 역할에 대해 활성(Active) 라디오 버튼을 선택합니다.
대기 Orchestrator 주소(Standby Orchestrator Address) 기본 대기 Orchestrator IP 주소를 입력합니다.
대기 Orchestrator 주소(IPv6)(Standby Orchestrator Address (IPv6)) 대기 Orchestrator IPv6 주소를 입력합니다.
대기 Orchestrator 보조 주소(Standby Orchestrator Secondary Address) 대기 Orchestrator 보조 인터페이스의 주소를 입력합니다. 이 주소는 대기가 활성 상태로 승격된 경우 복제에 사용합니다. 사용자는 여기에 Ipv4/Ipv6 또는 FQDN 주소를 추가할 수 있습니다.
대기 Orchestrator UUID(Standby Orchestrator UUID) 대기 Orchestrator의 UUID를 입력합니다.
구성 모드(Configuration Mode) 요구 사항에 따라 대기 자동 구성(Auto Configure Standby) 또는 대기 수동 구성(Manually Configure Standby) 라디오 버튼을 선택합니다.

수동으로 구성한 경우 ACTIVE VCO의 문자열 값을 STANDBY_WAIT로 붙여넣습니다

.
슈퍼유저 사용자 이름(Superuser Username) Orchestrator 슈퍼유저의 디스플레이 이름을 입력합니다.
대기 Orchestrator 슈퍼유저 암호(Standby Orchestrator Superuser Password) Orchestrator 슈퍼유저의 암호를 입력합니다.
  1. 복제 역할을 활성화하려면 활성에 사용(Enable for Active) 버튼을 클릭합니다.

구성이 완료되면 두 Orchestrator(대기 및 활성)가 모두 동기화됩니다.

동기화 상태의 대기 Orchestrator

동기화 상태의 활성 Orchestrator

테스트 페일오버

다음과 같은 테스트 페일오버 시나리오는 예를 제공하기 위한 강제 페일오버입니다. 활성(Active)대기(Standby) 화면의 사용 가능한 작업(Available Actions) 영역에서 이러한 작업을 수행할 수 있습니다.

대기 Orchestrator 승격

이 섹션에서는 대기 Orchestrator를 승격하는 방법을 설명합니다.

대기 Orchestrator를 승격하려면 다음 단계를 수행하십시오.

  1. 잠금 해제(unlock) 링크를 클릭합니다.
  2. 대기 Orchestrator 화면의 사용 가능한 작업(Available Actions) 영역에서 대기 승격(Promote Standby) 버튼을 클릭합니다.

    대기 Orchestrator를 승격하면 관리자가 이제 이전 활성 Orchestrator를 사용하여 SASE Orchestrator를 관리할 수 없음을 나타내는 다음과 같은 대화상자가 표시됩니다.

  3. 대기 승격(Promote Standby) 버튼을 클릭하여 대기 Orchestrator를 승격합니다.
  4. 대기 승격 강제 적용(Force Promote Standby)을 클릭하여 Orchestrator를 승격합니다.

    Orchestrator가 이제 대기 상태가 아님을 나타내는 마지막 대화상자가 표시되고 독립형 모드로 다시 시작됩니다.

대기 Orchestrator를 승격하면 독립 실행형 모드로 다시 시작됩니다.

대기 Orchestrator는 이전 활성 Orchestrator와 통신할 수 있는 경우 Orchestrator가 좀비 상태를 시작하도록 지시합니다. 좀비 상태에서 Orchestrator는 이제 활성 상태가 아니며 새로 승격된 Orchestrator와 통신해야 함을 클라이언트(Edge, 게이트웨이, UI/API)에 전달합니다. 승격된 대기 Orchestrator가 이전 활성 Orchestrator와 통신할 수 없는 경우 운영자는 가능하면 이전 활성 Orchestrator를 수동으로 강등해야 합니다.

독립형 모드로 돌아가기

좀비를 독립 실행형 모드로 되돌리려면 활성 Orchestrator(Active Orchestrator) 또는 대기 Orchestrator(Standby Orchestrator) 화면의 사용 가능한 작업(Available Actions) 영역에서 독립형 모드로 돌아가기(Return to Standalone Mode) 버튼을 클릭합니다.

참고:

Orchestrator는 시스템 속성 "vco.disasterRecovery.zombie.expirySeconds"(기본값 1800초)에 지정된 시간 후에 좀비 상태에서 독립형 모드로 전환될 수 있습니다.

SASE Orchestrator DR 문제 해결

이 섹션에서는 시스템의 오류 상태를 설명합니다. 이러한 오류 상태는 오류에 대한 자세한 설명과 함께 UI에 표시됩니다. 추가 정보는 VMware 로그에서 확인할 수 있습니다.

복구 가능한 오류

다음 오류는 SASE Orchestrator DR이 동기화 상태에 도달할 때 발생할 수 있는 복구 가능한 오류입니다. 이러한 오류의 원인이 되는 문제가 해결되면 SASE Orchestrator DR이 자동으로 정상 작동 상태로 돌아갑니다.

  • FAILURE_SYNCING_FILES
  • FAILURE_GET_STANDBY_STATUS
  • FAILURE_MYSQL_ACTIVE_STATUS
  • FAILURE_MYSQL_STANDBY_STATUS

복구 불가능한 오류

SASE Orchestrator DR을 구성하는 동안 다음 오류가 발생할 수 있습니다. SASE Orchestrator DR은 이러한 오류로부터 자동으로 복구되지 않습니다.

  • FAILURE_ACTIVE_CONFIGURING
  • FAILURE_LAUNCHING_STANDBY
  • FAILURE_STANDBY_CONFIGURING
  • FAILURE_COPYING_DB
  • FAILURE_COPYING_FILES
  • FAILURE_SYNC_CONFIGURING
  • FAILURE_GET_STANDBY_CONFIG
  • FAILURE_STANDBY_CANDIDATE
  • FAILURE_STANDBY_UNCONFIG
  • FAILURE_STANDBY_PROMOTION
  • FAILURE_ACTIVE_DEMOTION