Zotavení systému SASE Orchestrator po havárii (DR) zabraňuje ztrátě uložených dat a dokáže obnovit dostupnost služeb SASE Orchestrator v případě selhání systému nebo sítě.
- Stanovený čas pro obnovení (RTO) je proto závislý na explicitní akci operátora, při které se přepne priorita pohotovostního systému.
- Veškerá konfigurace se okamžitě replikuje, a stanovený bod pro obnovení (RPO) je proto v podstatě nulový bez ohledu na čas pro obnovení. Data z monitorování, která by byla jinak během výpadku shromážděna, jsou ukládána do mezipaměti v zařízení Edge a branách a čekají na přepnutí na pohotovostní režim.
Aktivní/pohotovostní režim
Při zavedení SASE Orchestrator DR se dva identické systémy SASE Orchestrator nakonfigurují jako pár aktivního/pohotovostního režimu. Operátor si může prohlédnout stav připravenosti funkce DR ve webovém uživatelském rozhraní na některém ze serverů. Zařízení Edge a brány mají přehled o obou systémech SASE Orchestrator, i když získávají informace o změně konfigurace pouze z aktivního systému SASE Orchestrator. Prezenční signály DR odesílají pravidelně do obou systémů, informují tak o viditelnosti obou serverů a zasílají dotazy na stav systému DR. Jakmile operátor spustí převzetí služeb při selhání, zařízení Edge a brány budou o změně informovány ve svém nejbližším prezenčním signálu DR.
Stavy DR
Z pohledu operátora, zařízení Edge a bran má systém SASE Orchestrator jeden ze čtyř následujících stavů DR:
Stav DR | Popis |
---|---|
Samostatný režim (Standalone) | Žádné DR není nakonfigurováno. |
Aktivní (Active) | Funkce DR je nakonfigurována a server se používá jako primární server SASE Orchestrator. |
Pohotovostní režim (Standby) | Funkce DR je nakonfigurována a server se používá jako neaktivní replikace serveru SASE Orchestrator. |
Zombie | Funkce DR byly dříve nakonfigurovány a aktivovány, ale server se již nepoužívá jako aktivní ani jako pohotovostní. |
Provozní operace (Run-time Operation)
Po nakonfigurování DR se pohotovostní server spustí v omezeném režimu, kde jsou zablokována všechna volání rozhraní API kromě těch, která souvisejí se stavem DR a prezenčními signály DR. Pokud operátor spustí převzetí služeb při selhání, pohotovostní server je povýšen (převeden) na plně funkční samostatný server. Server, který byl dříve aktivní, odpovídá a je viditelný z převedeného pohotovostního serveru, je automaticky převeden do stavu zombie. Ve stavu zombie jsou zablokovány všechny služby pro konfiguraci správy a jakýkoli kontakt ze zařízení Edge a bran, který zatím nebyl přesměrován na nový aktivní systém SASE Orchestrator, je přesměrován na převedený server.
Nastavení replikace systému SASE Orchestrator
K zahájení replikace jsou potřebné dvě nainstalované instance systému SASE Orchestrator.
- Vybraná instance v pohotovostním režimu se uvede do stavu
STANDBY_CANDIDATE
, což umožňuje její konfiguraci aktivním serverem. - Aktivnímu serveru se poté přidělí adresa a přihlašovací údaje instance v pohotovostním režimu, která poté přejde do stavu
ACTIVE_CONFIGURING
.
STANDBY_CONFIG_RQST
proveden z aktivního na pohotovostní, oba servery se synchronizují prostřednictvím přechodů stavů.
- Časové pásmo brány musí být nastaveno jako Etc/UTC. Pomocí následujícího příkazu zobrazíte časové pásmo NTP.
vcadmin@vcg1-example:~$ cat /etc/timezone Etc/UTC vcadmin@vcg1-example:~$
Pokud je časové pásmo nesprávné, aktualizujte je pomocí následujících příkazů.
echo "Etc/UTC" | sudo tee /etc/timezone sudo dpkg-reconfigure --frontend noninteractive tzdata
- Posun NTP musí být menší nebo roven 15 milisekundám. Pomocí následujícího příkazu zobrazíte posun NTP.
sudo ntpqvcadmin@vcg1-example:~$ sudo ntpq -p remote refid st t when poll reach delay offset jitter ============================================================================== *ntp1-us1.prod.v 74.120.81.219 3 u 474 1024 377 10.171 -1.183 1.033 ntp1-eu1-old.pr .INIT. 16 u - 1024 0 0.000 0.000 0.000 vcadmin@vcg1-example:~$
Pokud je offset NTP nesprávný, aktualizujte jej pomocí následujících příkazů.
sudo systemctl stop ntp sudo ntpdate <server> sudo systemctl start ntp
- Ve výchozím nastavení je v souboru
/etc/ntpd.conf
nakonfigurován seznam serverů NTP. Oba systémy Orchestrator, na kterých je potřeba vytvořit zotavení po havárii, musí mít přístup k internetu, aby se mohly připojovat k serverům NTP a synchronizovat čas. Zákazníci mohou také synchronizovat čas pomocí místního serveru NTP běžícího v jejich prostředí.
Nastavení systému Orchestrator v pohotovostním režimu (Standby Orchestrator)
Chcete-li nastavit systém Orchestrator v pohotovostním režimu, proveďte následující kroky:
- Ve službě SD-WAN na podnikovém portálu klikněte na kartu Orchestrator (Orchestrator) a poté v levém podokně klikněte na tlačítko Replikace (Replication), načež se otevře obrazovka Replikace systému Orchestrator (Orchestrator Replication).
- Výběrem přepínacího tlačítka Pohotovostní režim (Standby) (role replikace) aktivujte systém Orchestrator v pohotovostním režimu (Standby Orchestrator).
- Klikněte na tlačítko Povolit pro pohotovostní režim (Enable for Standby).
Zobrazí se stránka Systém Orchestrator v pohotovostním režimu (Standby Orchestrator).
- Zadejte parametry pro manuální konfiguraci (manual configuration) a klikněte na tlačítko Informace o konfiguraci aktualizace (Update configuration info).
Po nakonfigurování systému Orchestrator v pohotovostním režimu (Standby Orchestrator) pro replikaci nakonfigurujte systém Orchestrator v aktivním režimu (Active Orchestrator) podle níže uvedených pokynů.
Nastavení systému Orchestrator v aktivním režimu (Active Orchestrator)
Chcete-li nastavit aktivní systém Orchestrator, vyberte roli replikace jako aktivní a nakonfigurujte následující položky:
Možnost | Popis |
---|---|
Vybrat roli replikace (Select Replication Role) | Vyberte přepínač Aktivní (Active) pro roli replikace. |
Adresa systému Orchestrator v pohotovostním režimu (Standby Orchestrator Address) | Zadejte primární IP adresu systému Orchestrator v pohotovostním režimu. |
Adresa systému Orchestrator v pohotovostním režimu (IPv6) (Standby Orchestrator Address (IPv6)) | Zadejte adresu IPv6 systému Orchestrator v pohotovostním režimu. |
Sekundární adresa názvu systému Orchestrator v pohotovostním režimu (Standby Orchestrator Secondary Address) | Zadejte adresu sekundárního rozhraní systému Orchestrator v pohotovostním režimu. Tato adresa se používá pro replikaci, pokud je pohotovostní režim převeden na aktivní. Sem mohou uživatelé přidat adresu IPv4/IPv6 nebo název FQDN. |
UUID systému Orchestrator v pohotovostním režimu (Standby Orchestrator UUID) | Zadejte identifikátor UUID systému Orchestrator v pohotovostním režimu. |
Režim konfigurace (Configuration Mode) | Vyberte přepínač Automatická konfigurace pohotovostního režimu (Auto Configure Standby) nebo Manuální konfigurace pohotovostního režimu (Manually Configure Standby) podle potřeby. Při manuální konfiguraci vložte hodnotu řetězce z ACTIVE VCO do STANDBY_WAIT . |
Uživatelské jméno primárního uživatele (Superuser Username) | Zadejte zobrazovaný název primárního uživatele systému Orchestrator. |
Heslo primárního uživatele systému Orchestrator v pohotovostním režimu (Standby Orchestrator Superuser Password) | Zadejte heslo primárního uživatele systému Orchestrator. |
- Chcete-li aktivovat roli replikace, klikněte na tlačítko Aktivovat pro aktivní (Enable for Active).
Po dokončení konfigurace jsou systémy Orchestrator v aktivním i pohotovostním režimu synchronizovány.
Synchronizace systému Orchestrator v pohotovostním režimu
Synchronizace systému Orchestrator v aktivním režimu
Test převzetí služeb při selhání
Následující zkušební scénáře převzetí služeb při selhání představují scénáře vynuceného selhání pro účely příkladu. Tyto akce můžete provést v oblasti Dostupné akce (Available Actions) na obrazovkách Aktivní režim (Active) a Pohotovostní režim (Standby) .
Povýšení systému Standby Orchestrator
Tento oddíl popisuje postup povýšení systému Standby Orchestrator.
Chcete-li propagovat Orchestrator v pohotovostním režimu, proveďte následující kroky:
- Klepněte na odkaz odemknout (unlock).
- V oblasti Dostupné akce (Available Actions) na obrazovce systému Standby Orchestrator klepněte na tlačítko Povýšit Standby (Promote Standby).
Zobrazí se následující dialogové okno s informacemi o tom, že pokud povýšíte pohotovostní režim systém Orchestrator, administrátoři již nebudou moci spravovat systém SASE Orchestrator pomocí předchozího aktivního režimu systému Orchestrator.
- Kliknutím na tlačítko Povýšit pohotovostní režim (Promote Standby) povýšíte systém Orchestrator v pohotovostním režimu.
- Kliknutím na tlačítko Vynutit povýšení pohotovostního režimu (Force Promote Standby) povýšíte systém Orchestrator.
Objeví se závěrečné dialogové okno s informacemi o tom, že systém Orchestrator již není v pohotovostním režimu (Standby) a restartuje se do samostatného režimu (Standalone).
Pokud povýšíte systém Orchestrator v pohotovostním režimu, restartuje se do samostatného režimu.
Pokud může systém Orchestrator v pohotovostním režimu (Standby Orchestrator) komunikovat s dřívějším systémem Orchestrator v aktivním režimu (Active Orchestrator), odešle mu příkaz přejít do stavu Zombie. Ve stavu Zombie systém Orchestrator sdělí svým klientům (nástrojům edge, bránám, UI/API), že již není aktivní a že musí komunikovat s nově povýšeným systémem Orchestrator. Pokud nemůže povýšený systém Standby Orchestrator komunikovat s předchozím systémem Active Orchestrator, musí operátor, pokud je to možné, předcházející systém Active Orchestrator deaktivovat.
Návrat do samsotatného režimu
Chcete-li stav Zombie přepnout zpět do samostatného režimu (Standalone), klikněte na tlačítko Návrat do samsotatného režimu (Return to Standalone Mode) v oblasti Dostupné akce (Available Actions) na obrazovkách Orchestrator v aktivním režimu (Active Orchestrator) nebo Orchestrator v pohotovostním režimu (Standby Orchestrator)
Software Orchestrator ve stavu Zombie lze vrátit do samostatného režimu po uplynutí doby specifikované ve vlastnosti systému „vco.disasterRecovery.zombie.expirySeconds“, která má ve výchozím nastavení hodnotu 1 800 sekund.
Řešení potíží v systému SASE Orchestrator DR
Tento oddíl popisuje stavy selhání systému. Jsou uvedené rovněž v uživatelském rozhraní spolu s podrobnějším popisem selhání. Další informace jsou k dispozici v protokolu VMware.
Odstranitelné chyby
Následující chyby jsou odstranitelné chyby, ke kterým může dojít poté, co systém SASE Orchestrator DR dosáhne stavu synchronizace. Pokud je problém, který chyby způsobil, odstraněn, systém SASE Orchestrator DR se automaticky vrátí do normálního provozu.
FAILURE_SYNCING_FILES
FAILURE_GET_STANDBY_STATUS
FAILURE_MYSQL_ACTIVE_STATUS
FAILURE_MYSQL_STANDBY_STATUS
Neodstranitelné chyby
Během konfigurace systému SASE Orchestrator DR se mohou vyskytnout následující chyby. Systém SASE Orchestrator DR se po těchto chybách automaticky neobnoví.
FAILURE_ACTIVE_CONFIGURING
FAILURE_LAUNCHING_STANDBY
FAILURE_STANDBY_CONFIGURING
FAILURE_COPYING_DB
FAILURE_COPYING_FILES
FAILURE_SYNC_CONFIGURING
FAILURE_GET_STANDBY_CONFIG
FAILURE_STANDBY_CANDIDATE
FAILURE_STANDBY_UNCONFIG
FAILURE_STANDBY_PROMOTION
FAILURE_ACTIVE_DEMOTION