Zotavení systému SD-WAN Orchestrator po havárii (DR) zabraňuje ztrátě uložených dat a dokáže obnovit dostupnost služeb SD-WAN Orchestrator v případě selhání systému nebo sítě.

Funkce zotavení SD-WAN Orchestrator zahrnuje nastavení párování aktivního/pohotovostního režimu systému SD-WAN Orchestrator s replikací dat a ručním spuštěním mechanismu převzetí služeb při selhání.
  • Stanovený čas pro obnovení (RTO) je proto závislý na explicitní akci operátora, při které se přepne priorita pohotovostního systému.
  • Veškerá konfigurace se okamžitě replikuje, a stanovený bod pro obnovení (RPO) je proto v podstatě nulový bez ohledu na čas pro obnovení. Data z monitorování, která by byla jinak během výpadku shromážděna, jsou ukládána do mezipaměti v zařízení Edge a branách a čekají na přepnutí na pohotovostní režim.
Poznámka: Používání funkce DR je povinné. Informace o licencování a ceně získáte od prodejního týmu společnosti VMware.

Aktivní/pohotovostní režim

Při zavedení SD-WAN Orchestrator DR se dva identické systémy SD-WAN Orchestrator nakonfigurují jako pár aktivního/pohotovostního režimu. Operátor si může prohlédnout stav připravenosti funkce DR ve webovém uživatelském rozhraní na některém ze serverů. Zařízení Edge a brány mají přehled o obou systémech SD-WAN Orchestrator, i když získávají informace o změně konfigurace pouze z aktivního systému SD-WAN Orchestrator. Prezenční signály DR odesílají pravidelně do obou systémů, informují tak o viditelnosti obou serverů a zasílají dotazy na stav systému DR. Jakmile operátor spustí převzetí služeb při selhání, zařízení Edge a brány budou o změně informovány ve svém nejbližším prezenčním signálu DR.

Stavy DR

Z pohledu operátora, zařízení Edge a bran má systém SD-WAN Orchestrator jeden ze čtyř následujících stavů DR:

Stav DR Popis (Description)
Samostatný režim (Standalone) Žádné DR není nakonfigurováno.
Aktivní Funkce DR je nakonfigurována a server se používá jako primární server SD-WAN Orchestrator.
Pohotovostní režim (Standby) Funkce DR je nakonfigurována a server se používá jako neaktivní replikace serveru SD-WAN Orchestrator.
Zombie Funkce DR byly dříve nakonfigurovány a aktivovány, ale server se již nepoužívá jako aktivní ani jako pohotovostní.

Provozní operace (Run-time Operation)

Po nakonfigurování DR se pohotovostní server spustí v omezeném režimu, kde jsou zablokována všechna volání rozhraní API kromě těch, která souvisejí se stavem DR a prezenčními signály DR. Pokud operátor spustí převzetí služeb při selhání, pohotovostní server je povýšen (převeden) na plně funkční samostatný server. Server, který byl dříve aktivní, odpovídá a je viditelný z převedeného pohotovostního serveru, je automaticky převeden do stavu zombie. Ve stavu zombie jsou zablokovány všechny služby pro konfiguraci správy a jakýkoli kontakt ze zařízení Edge a bran, který zatím nebyl přesměrován na nový aktivní systém SD-WAN Orchestrator, je přesměrován na převedený server.

disaster-recovery-replica-and-status

Nastavení replikace systému SD-WAN Orchestrator

K zahájení replikace jsou potřebné dvě nainstalované instance systému SD-WAN Orchestrator.

  • Vybraná instance v pohotovostním režimu se uvede do stavu STANDBY_CANDIDATE, což umožňuje její konfiguraci aktivním serverem.
  • Aktivnímu serveru se poté přidělí adresa a přihlašovací údaje instance v pohotovostním režimu, která poté přejde do stavu ACTIVE_CONFIGURING.
Pokud je STANDBY_CONFIG_RQST proveden z aktivního na pohotovostní, oba servery se synchronizují prostřednictvím přechodů stavů.
Oba systémy Orchestrator, na kterých je potřeba vytvořit zotavení po havárii, musí mít nastaven stejný čas. Než zahájíte replikaci SD-WAN Orchestrator, nejprve zkontrolujte následující konfigurace protokolu NTP:
  • Časové pásmo brány musí být nastaveno jako Etc/UTC. Pomocí následujícího příkazu zobrazíte časové pásmo NTP.
    vcadmin@vcg1-example:~$ cat /etc/timezone
    Etc/UTC
    vcadmin@vcg1-example:~$ 
    

    Pokud je časové pásmo nesprávné, aktualizujte je pomocí následujících příkazů.

    echo "Etc/UTC" | sudo tee /etc/timezone
    sudo dpkg-reconfigure --frontend noninteractive tzdata
    
  • Posun NTP musí být menší nebo roven 15 milisekundám. Pomocí následujícího příkazu zobrazíte posun NTP.
    sudo ntpqvcadmin@vcg1-example:~$ sudo ntpq -p
         remote           refid      st t when poll reach   delay   offset  jitter
    ==============================================================================
    *ntp1-us1.prod.v 74.120.81.219    3 u  474 1024  377   10.171   -1.183   1.033
     ntp1-eu1-old.pr .INIT.          16 u    - 1024    0    0.000    0.000   0.000
    vcadmin@vcg1-example:~$ 
    

    Pokud je offset NTP nesprávný, aktualizujte jej pomocí následujících příkazů.

    sudo systemctl stop ntp
    sudo ntpdate <server>
    sudo systemctl start ntp
  • Ve výchozím nastavení je v souboru /etc/ntpd.conf nakonfigurován seznam serverů NTP. Oba systémy Orchestrator, na kterých je potřeba vytvořit zotavení po havárii, musí mít přístup k internetu, aby se mohly připojovat k serverům NTP a synchronizovat čas. Zákazníci mohou také synchronizovat čas pomocí místního serveru NTP běžícího v jejich prostředí.

Nastavení systému Orchestrator v pohotovostním režimu (Standby Orchestrator)

Chcete-li nastavit systém SD-WAN Orchestrator v pohotovostním režimu (Standby Orchestrator), proveďte následující kroky:

  1. V portálu operátora klikněte na kartu Orchestrator (Orchestrator) a poté v levém podokně klikněte na tlačítko Replikace (Replication), načež se zobrazí obrazovka Replikace systému Orchestrator (Orchestrator Replication).
  2. Výběrem přepínacího tlačítka Pohotovostní režim (Standby) (role replikace) aktivujte systém Orchestrator v pohotovostním režimu (Standby Orchestrator).
  3. Klikněte na tlačítko Povolit pro pohotovostní režim (Enable for Standby).

    Zobrazí se stránka Systém Orchestrator v pohotovostním režimu (Standby Orchestrator).

  4. Zadejte parametry pro manuální konfiguraci (manual configuration) a klikněte na tlačítko Informace o konfiguraci aktualizace (Update configuration info).

    Po nakonfigurování systému Orchestrator v pohotovostním režimu (Standby Orchestrator) pro replikaci nakonfigurujte systém Orchestrator v aktivním režimu (Active Orchestrator) podle níže uvedených pokynů.

Nastavení systému Orchestrator v aktivním režimu (Active Orchestrator)

Chcete-li nastavit aktivní systém SD-WAN Orchestrator, vyberte roli replikace jako aktivní a nakonfigurujte následující:

Možnost Popis
Vybrat roli replikace (Select Replication Role) Vyberte přepínač Aktivní (Active) pro roli replikace.
Adresa systému Orchestrator v pohotovostním režimu (Standby Orchestrator Address) Zadejte primární IP adresu systému Orchestrator v pohotovostním režimu.
Adresa systému Orchestrator v pohotovostním režimu (IPv6) (Standby Orchestrator Address (IPv6)) Zadejte adresu IPv6 systému Orchestrator v pohotovostním režimu.
Sekundární adresa názvu systému Orchestrator v pohotovostním režimu (Standby Orchestrator Secondary Address) Zadejte adresu sekundárního rozhraní systému Orchestrator v pohotovostním režimu. Tato adresa se používá pro replikaci, pokud je pohotovostní režim převeden na aktivní. Sem mohou uživatelé přidat adresu IPv4/IPv6 nebo název FQDN.
UUID systému Orchestrator v pohotovostním režimu (Standby Orchestrator UUID) Zadejte identifikátor UUID systému Orchestrator v pohotovostním režimu.
Režim konfigurace (Configuration Mode) Vyberte přepínač Automatická konfigurace pohotovostního režimu (Auto Configure Standby) nebo Manuální konfigurace pohotovostního režimu (Manually Configure Standby) podle potřeby.

Při manuální konfiguraci vložte hodnotu řetězce z ACTIVE VCO do STANDBY_WAIT

.
Uživatelské jméno primárního uživatele (Superuser Username) Zadejte zobrazovaný název primárního uživatele systému Orchestrator.
Heslo primárního uživatele systému Orchestrator v pohotovostním režimu (Standby Orchestrator Superuser Password) Zadejte heslo primárního uživatele systému Orchestrator.
  1. Chcete-li aktivovat roli replikace, klikněte na tlačítko Aktivovat pro aktivní (Enable for Active).

Po dokončení konfigurace jsou systémy Orchestrator v aktivním i pohotovostním režimu synchronizovány.

Synchronizace systému Orchestrator v pohotovostním režimu

Synchronizace systému Orchestrator v aktivním režimu

Test převzetí služeb při selhání

Následující zkušební scénáře převzetí služeb při selhání představují scénáře vynuceného selhání pro účely příkladu. Tyto akce můžete provést v oblasti Dostupné akce (Available Actions) na obrazovkách Aktivní režim (Active)Pohotovostní režim (Standby) .

Povýšení systému Standby Orchestrator

Tento oddíl popisuje postup povýšení systému Standby Orchestrator.

Chcete-li propagovat Orchestrator v pohotovostním režimu, proveďte následující kroky:

  1. Klepněte na odkaz odemknout (unlock).
  2. V oblasti Dostupné akce (Available Actions) na obrazovce systému Standby Orchestrator klepněte na tlačítko Povýšit Standby (Promote Standby).

    Zobrazí se následující dialogové okno s informacemi o tom, že pokud povýšíte svůj systém Orchestrator v pohotovostním režimu (Standby Orchestrator), administrátoři již nebudou moci spravovat systém SD-WAN Orchestrator pomocí předchozího systému Orchestrator v aktivním režimu (Active Orchestrator).

  3. Kliknutím na tlačítko Povýšit pohotovostní režim (Promote Standby) povýšíte systém Orchestrator v pohotovostním režimu.
  4. Kliknutím na tlačítko Vynutit povýšení pohotovostního režimu (Force Promote Standby) povýšíte systém Orchestrator.

    Objeví se závěrečné dialogové okno s informacemi o tom, že systém Orchestrator již není v pohotovostním režimu (Standby) a restartuje se do samostatného režimu (Standalone).

Pokud povýšíte systém Orchestrator v pohotovostním režimu, restartuje se do samostatného režimu.

Pokud může systém Orchestrator v pohotovostním režimu (Standby Orchestrator) komunikovat s dřívějším systémem Orchestrator v aktivním režimu (Active Orchestrator), odešle mu příkaz přejít do stavu Zombie. Ve stavu Zombie systém Orchestrator sdělí svým klientům (nástrojům edge, bránám, UI/API), že již není aktivní a že musí komunikovat s nově povýšeným systémem Orchestrator. Pokud nemůže povýšený systém Standby Orchestrator komunikovat s předchozím systémem Active Orchestrator, musí operátor, pokud je to možné, předcházející systém Active Orchestrator deaktivovat.

Návrat do samsotatného režimu

Chcete-li stav Zombie přepnout zpět do samostatného režimu (Standalone), klikněte na tlačítko Návrat do samsotatného režimu (Return to Standalone Mode) v oblasti Dostupné akce (Available Actions) na obrazovkách Orchestrator v aktivním režimu (Active Orchestrator) nebo Orchestrator v pohotovostním režimu (Standby Orchestrator)

Poznámka:

Software Orchestrator ve stavu Zombie lze vrátit do samostatného režimu po uplynutí doby specifikované ve vlastnosti systému „vco.disasterRecovery.zombie.expirySeconds“, která má ve výchozím nastavení hodnotu 1 800 sekund.

Řešení potíží se systémem SD-WAN Orchestrator DR

Tento oddíl popisuje stavy selhání systému. Jsou uvedené rovněž v uživatelském rozhraní spolu s podrobnějším popisem selhání. Další informace jsou k dispozici v protokolu VMware.

Odstranitelné chyby

Následující chyby jsou odstranitelné chyby, ke kterým může dojít poté, co systém SD-WAN Orchestrator DR dosáhne stavu synchronizace. Pokud je problém, který chyby způsobil, odstraněn, systém SD-WAN Orchestrator DR se automaticky vrátí do normálního provozu.

  • FAILURE_SYNCING_FILES
  • FAILURE_GET_STANDBY_STATUS
  • FAILURE_MYSQL_ACTIVE_STATUS
  • FAILURE_MYSQL_STANDBY_STATUS

Neodstranitelné chyby

Během konfigurace systému SD-WAN Orchestrator DR se mohou vyskytnout následující chyby. Systém SD-WAN Orchestrator DR se po těchto chybách automaticky neobnoví.

  • FAILURE_ACTIVE_CONFIGURING
  • FAILURE_LAUNCHING_STANDBY
  • FAILURE_STANDBY_CONFIGURING
  • FAILURE_COPYING_DB
  • FAILURE_COPYING_FILES
  • FAILURE_SYNC_CONFIGURING
  • FAILURE_GET_STANDBY_CONFIG
  • FAILURE_STANDBY_CANDIDATE
  • FAILURE_STANDBY_UNCONFIG
  • FAILURE_STANDBY_PROMOTION
  • FAILURE_ACTIVE_DEMOTION