Zotavení systému SD-WAN Orchestrator po havárii (DR) zabraňuje ztrátě uložených dat a dokáže obnovit dostupnost služeb SD-WAN Orchestrator v případě selhání systému nebo sítě.
- Stanovený čas pro obnovení (RTO) je proto závislý na explicitní akci operátora, při které se přepne priorita pohotovostního systému.
- Veškerá konfigurace se okamžitě replikuje, a stanovený bod pro obnovení (RPO) je proto v podstatě nulový bez ohledu na čas pro obnovení. Data z monitorování, která by byla jinak během výpadku shromážděna, jsou ukládána do mezipaměti v zařízení Edge a branách a čekají na přepnutí na pohotovostní režim.
Aktivní/pohotovostní režim
Při zavedení SD-WAN Orchestrator DR se dva identické systémy SD-WAN Orchestrator nakonfigurují jako pár aktivního/pohotovostního režimu. Operátor si může prohlédnout stav připravenosti funkce DR ve webovém uživatelském rozhraní na některém ze serverů. Zařízení Edge a brány mají přehled o obou systémech SD-WAN Orchestrator, i když získávají informace o změně konfigurace pouze z aktivního systému SD-WAN Orchestrator. Prezenční signály DR odesílají pravidelně do obou systémů, informují tak o viditelnosti obou serverů a zasílají dotazy na stav systému DR. Jakmile operátor spustí převzetí služeb při selhání, zařízení Edge a brány budou o změně informovány ve svém nejbližším prezenčním signálu DR.
Stavy DR
Z pohledu operátora, zařízení Edge a bran má systém SD-WAN Orchestrator jeden ze čtyř následujících stavů DR:
Stav DR | Popis (Description) |
---|---|
Samostatný režim (Standalone) | Žádné DR není nakonfigurováno. |
Aktivní | Funkce DR je nakonfigurována a server se používá jako primární server SD-WAN Orchestrator. |
Pohotovostní režim (Standby) | Funkce DR je nakonfigurována a server se používá jako neaktivní replikace serveru SD-WAN Orchestrator. |
Zombie | Funkce DR byly dříve nakonfigurovány a aktivovány, ale server se již nepoužívá jako aktivní ani jako pohotovostní. |
Provozní operace (Run-time Operation)
Po nakonfigurování DR se pohotovostní server spustí v omezeném režimu, kde jsou zablokována všechna volání rozhraní API kromě těch, která souvisejí se stavem DR a prezenčními signály DR. Pokud operátor spustí převzetí služeb při selhání, pohotovostní server je povýšen (převeden) na plně funkční samostatný server. Server, který byl dříve aktivní, odpovídá a je viditelný z převedeného pohotovostního serveru, je automaticky převeden do stavu zombie. Ve stavu zombie jsou zablokovány všechny služby pro konfiguraci správy a jakýkoli kontakt ze zařízení Edge a bran, který zatím nebyl přesměrován na nový aktivní systém SD-WAN Orchestrator, je přesměrován na převedený server.
Nastavení replikace systému SD-WAN Orchestrator
K zahájení replikace jsou potřebné dvě nainstalované instance systému SD-WAN Orchestrator.
- Vybraná instance v pohotovostním režimu se uvede do stavu
STANDBY_CANDIDATE
, což umožňuje její konfiguraci aktivním serverem. - Aktivnímu serveru se poté přidělí adresa a přihlašovací údaje instance v pohotovostním režimu, která poté přejde do stavu
ACTIVE_CONFIGURING
.
STANDBY_CONFIG_RQST
proveden z aktivního na pohotovostní, oba servery se synchronizují prostřednictvím přechodů stavů.
- Časové pásmo brány musí být nastaveno jako Etc/UTC. Pomocí následujícího příkazu zobrazíte časové pásmo NTP.
vcadmin@vcg1-example:~$ cat /etc/timezone Etc/UTC vcadmin@vcg1-example:~$
Pokud je časové pásmo nesprávné, aktualizujte je pomocí následujících příkazů.
echo "Etc/UTC" | sudo tee /etc/timezone sudo dpkg-reconfigure --frontend noninteractive tzdata
- Posun NTP musí být menší nebo roven 15 milisekundám. Pomocí následujícího příkazu zobrazíte posun NTP.
sudo ntpqvcadmin@vcg1-example:~$ sudo ntpq -p remote refid st t when poll reach delay offset jitter ============================================================================== *ntp1-us1.prod.v 74.120.81.219 3 u 474 1024 377 10.171 -1.183 1.033 ntp1-eu1-old.pr .INIT. 16 u - 1024 0 0.000 0.000 0.000 vcadmin@vcg1-example:~$
Pokud je offset NTP nesprávný, aktualizujte jej pomocí následujících příkazů.
sudo systemctl stop ntp sudo ntpdate <server> sudo systemctl start ntp
- Ve výchozím nastavení je v souboru
/etc/ntpd.conf
nakonfigurován seznam serverů NTP. Oba systémy Orchestrator, na kterých je potřeba vytvořit zotavení po havárii, musí mít přístup k internetu, aby se mohly připojovat k serverům NTP a synchronizovat čas. Zákazníci mohou také synchronizovat čas pomocí místního serveru NTP běžícího v jejich prostředí.
Nastavení systému Orchestrator v pohotovostním režimu (Standby Orchestrator)
Chcete-li nastavit systém SD-WAN Orchestrator v pohotovostním režimu (Standby Orchestrator), proveďte následující kroky:
- V portálu operátora klikněte na kartu Orchestrator (Orchestrator) a poté v levém podokně klikněte na tlačítko Replikace (Replication), načež se zobrazí obrazovka Replikace systému Orchestrator (Orchestrator Replication).
- Výběrem přepínacího tlačítka Pohotovostní režim (Standby) (role replikace) aktivujte systém Orchestrator v pohotovostním režimu (Standby Orchestrator).
- Klikněte na tlačítko Povolit pro pohotovostní režim (Enable for Standby).
Zobrazí se stránka Systém Orchestrator v pohotovostním režimu (Standby Orchestrator).
- Zadejte parametry pro manuální konfiguraci (manual configuration) a klikněte na tlačítko Informace o konfiguraci aktualizace (Update configuration info).
Po nakonfigurování systému Orchestrator v pohotovostním režimu (Standby Orchestrator) pro replikaci nakonfigurujte systém Orchestrator v aktivním režimu (Active Orchestrator) podle níže uvedených pokynů.
Nastavení systému Orchestrator v aktivním režimu (Active Orchestrator)
Chcete-li nastavit aktivní systém SD-WAN Orchestrator, vyberte roli replikace jako aktivní a nakonfigurujte následující:
Možnost | Popis |
---|---|
Vybrat roli replikace (Select Replication Role) | Vyberte přepínač Aktivní (Active) pro roli replikace. |
Adresa systému Orchestrator v pohotovostním režimu (Standby Orchestrator Address) | Zadejte primární IP adresu systému Orchestrator v pohotovostním režimu. |
Adresa systému Orchestrator v pohotovostním režimu (IPv6) (Standby Orchestrator Address (IPv6)) | Zadejte adresu IPv6 systému Orchestrator v pohotovostním režimu. |
Sekundární adresa názvu systému Orchestrator v pohotovostním režimu (Standby Orchestrator Secondary Address) | Zadejte adresu sekundárního rozhraní systému Orchestrator v pohotovostním režimu. Tato adresa se používá pro replikaci, pokud je pohotovostní režim převeden na aktivní. Sem mohou uživatelé přidat adresu IPv4/IPv6 nebo název FQDN. |
UUID systému Orchestrator v pohotovostním režimu (Standby Orchestrator UUID) | Zadejte identifikátor UUID systému Orchestrator v pohotovostním režimu. |
Režim konfigurace (Configuration Mode) | Vyberte přepínač Automatická konfigurace pohotovostního režimu (Auto Configure Standby) nebo Manuální konfigurace pohotovostního režimu (Manually Configure Standby) podle potřeby. Při manuální konfiguraci vložte hodnotu řetězce z ACTIVE VCO do STANDBY_WAIT . |
Uživatelské jméno primárního uživatele (Superuser Username) | Zadejte zobrazovaný název primárního uživatele systému Orchestrator. |
Heslo primárního uživatele systému Orchestrator v pohotovostním režimu (Standby Orchestrator Superuser Password) | Zadejte heslo primárního uživatele systému Orchestrator. |
- Chcete-li aktivovat roli replikace, klikněte na tlačítko Aktivovat pro aktivní (Enable for Active).
Po dokončení konfigurace jsou systémy Orchestrator v aktivním i pohotovostním režimu synchronizovány.
Synchronizace systému Orchestrator v pohotovostním režimu
Synchronizace systému Orchestrator v aktivním režimu
Test převzetí služeb při selhání
Následující zkušební scénáře převzetí služeb při selhání představují scénáře vynuceného selhání pro účely příkladu. Tyto akce můžete provést v oblasti Dostupné akce (Available Actions) na obrazovkách Aktivní režim (Active) a Pohotovostní režim (Standby) .
Povýšení systému Standby Orchestrator
Tento oddíl popisuje postup povýšení systému Standby Orchestrator.
Chcete-li propagovat Orchestrator v pohotovostním režimu, proveďte následující kroky:
- Klepněte na odkaz odemknout (unlock).
- V oblasti Dostupné akce (Available Actions) na obrazovce systému Standby Orchestrator klepněte na tlačítko Povýšit Standby (Promote Standby).
Zobrazí se následující dialogové okno s informacemi o tom, že pokud povýšíte svůj systém Orchestrator v pohotovostním režimu (Standby Orchestrator), administrátoři již nebudou moci spravovat systém SD-WAN Orchestrator pomocí předchozího systému Orchestrator v aktivním režimu (Active Orchestrator).
- Kliknutím na tlačítko Povýšit pohotovostní režim (Promote Standby) povýšíte systém Orchestrator v pohotovostním režimu.
- Kliknutím na tlačítko Vynutit povýšení pohotovostního režimu (Force Promote Standby) povýšíte systém Orchestrator.
Objeví se závěrečné dialogové okno s informacemi o tom, že systém Orchestrator již není v pohotovostním režimu (Standby) a restartuje se do samostatného režimu (Standalone).
Pokud povýšíte systém Orchestrator v pohotovostním režimu, restartuje se do samostatného režimu.
Pokud může systém Orchestrator v pohotovostním režimu (Standby Orchestrator) komunikovat s dřívějším systémem Orchestrator v aktivním režimu (Active Orchestrator), odešle mu příkaz přejít do stavu Zombie. Ve stavu Zombie systém Orchestrator sdělí svým klientům (nástrojům edge, bránám, UI/API), že již není aktivní a že musí komunikovat s nově povýšeným systémem Orchestrator. Pokud nemůže povýšený systém Standby Orchestrator komunikovat s předchozím systémem Active Orchestrator, musí operátor, pokud je to možné, předcházející systém Active Orchestrator deaktivovat.
Návrat do samsotatného režimu
Chcete-li stav Zombie přepnout zpět do samostatného režimu (Standalone), klikněte na tlačítko Návrat do samsotatného režimu (Return to Standalone Mode) v oblasti Dostupné akce (Available Actions) na obrazovkách Orchestrator v aktivním režimu (Active Orchestrator) nebo Orchestrator v pohotovostním režimu (Standby Orchestrator)
Software Orchestrator ve stavu Zombie lze vrátit do samostatného režimu po uplynutí doby specifikované ve vlastnosti systému „vco.disasterRecovery.zombie.expirySeconds“, která má ve výchozím nastavení hodnotu 1 800 sekund.
Řešení potíží se systémem SD-WAN Orchestrator DR
Tento oddíl popisuje stavy selhání systému. Jsou uvedené rovněž v uživatelském rozhraní spolu s podrobnějším popisem selhání. Další informace jsou k dispozici v protokolu VMware.
Odstranitelné chyby
Následující chyby jsou odstranitelné chyby, ke kterým může dojít poté, co systém SD-WAN Orchestrator DR dosáhne stavu synchronizace. Pokud je problém, který chyby způsobil, odstraněn, systém SD-WAN Orchestrator DR se automaticky vrátí do normálního provozu.
FAILURE_SYNCING_FILES
FAILURE_GET_STANDBY_STATUS
FAILURE_MYSQL_ACTIVE_STATUS
FAILURE_MYSQL_STANDBY_STATUS
Neodstranitelné chyby
Během konfigurace systému SD-WAN Orchestrator DR se mohou vyskytnout následující chyby. Systém SD-WAN Orchestrator DR se po těchto chybách automaticky neobnoví.
FAILURE_ACTIVE_CONFIGURING
FAILURE_LAUNCHING_STANDBY
FAILURE_STANDBY_CONFIGURING
FAILURE_COPYING_DB
FAILURE_COPYING_FILES
FAILURE_SYNC_CONFIGURING
FAILURE_GET_STANDBY_CONFIG
FAILURE_STANDBY_CANDIDATE
FAILURE_STANDBY_UNCONFIG
FAILURE_STANDBY_PROMOTION
FAILURE_ACTIVE_DEMOTION