Η δυνατότητα Αποκατάστασης Καταστροφών (DR) του SD-WAN Orchestrator αποτρέπει την απώλεια αποθηκευμένων δεδομένων και συνεχίζει τις υπηρεσίες SD-WAN Orchestrator σε περίπτωση αποτυχίας του συστήματος ή του δικτύου.

Το SD-WAN Orchestrator DR περιλαμβάνει τη ρύθμιση ενός ενεργού/εφεδρικού ζεύγους SD-WAN Orchestrator με αντιγραφή δεδομένων και μηχανισμό ανακατεύθυνσης που ενεργοποιείται με μη αυτόματο τρόπο.
  • Ως εκ τούτου, ο στόχος του χρόνου αποκατάστασης (RTO) εξαρτάται από τη ρητή ενέργεια του χειριστή για ενεργοποίηση προβιβασμού του διακομιστή που βρίσκεται σε αναμονή.
  • Ο στόχος του σημείου αποκατάστασης (RPO), ωστόσο, είναι ουσιαστικά μηδέν, ανεξάρτητα από το χρόνο αποκατάστασης, γιατί όλες οι ρυθμίσεις παραμέτρων αντιγράφονται άμεσα. Η παρακολούθηση των δεδομένων που θα είχαν συλλεχθεί κατά τη διάρκεια της διακοπής αποθηκεύεται σε cache στα Edge και στις πύλες εν αναμονή του προβιβασμού του διακομιστή αναμονής.
Σημείωση: Η DR είναι υποχρεωτική. Για άδειες χρήσης και τιμολόγηση, επικοινωνήστε με την ομάδα πωλήσεων του VMware για υποστήριξη.

Ζεύγος Ενεργό/Σε αναμονή

Σε μια ανάπτυξη DR του SD-WAN Orchestrator, δύο πανομοιότυπα συστήματα SD-WAN Orchestrator διαμορφώνονται ως ζεύγος ενεργό/σε αναμονή. Ο χειριστής μπορεί να προβάλει την κατάσταση ετοιμότητας DR μέσω του περιβάλλοντος εργασίας χρήστη web σε οποιονδήποτε από τους διακομιστές. Τα Edge και οι πύλες γνωρίζουν και τα δύο SD-WAN Orchestrator και ενώ λαμβάνουν αλλαγές διαμόρφωσης μόνο από το ενεργό SD-WAN Orchestrator,στέλνουν περιοδικά παλμούς DR και στα δύο συστήματα για να αναφέρουν την προβολή και των δύο διακομιστών και να υποβάλουν ερώτημα για την κατάσταση του συστήματος DR. Όταν ο χειριστής ενεργοποιεί μια ανακατεύθυνση, τα Edge και οι πύλες ενημερώνονται για την αλλαγή στον επόμενο παλμό DR.

Καταστάσεις DR

Από την προβολή ενός χειριστή, καθώς και των Edge και των πυλών, ένα SD-WAN Orchestrator έχει μία από τις ακόλουθες τέσσερις καταστάσεις DR:

Κατάσταση DR Περιγραφή
Αυτόνομο (Standalone) Δεν έχει διαμορφωθεί DR.
Ενεργό (Active) Το DR έχει διαμορφωθεί κι ενεργεί ως ο κύριος διακομιστής του SD-WAN Orchestrator.
Σε αναμονή (Standby) Το DR έχει διαμορφωθεί κι ενεργεί ως ανενεργό αντίγραφο διακομιστή SD-WAN Orchestrator.
Zombie (Zombie) Το DR είχε διαμορφωθεί προηγουμένως και ήταν ενεργό, αλλά δεν ενεργεί πλέον ως ενεργό ή σε κατάσταση αναμονής.

Λειτουργία χρόνου εκτέλεσης (Run-time Operation)

Όταν έχει διαμορφωθεί το DR, ο διακομιστής αναμονής εκτελείται σε περιορισμένη λειτουργία, αποκλείοντας όλες τις κλήσεις API εκτός από εκείνες που σχετίζονται με την κατάσταση DR και τους παλμούς DR. Όταν ο χειριστής καλεί μια ανακατεύθυνση, ο διακομιστής σε αναμονή προβιβάζεται για να γίνει πλήρως λειτουργικός ως αυτόνομος διακομιστής. Ο διακομιστής που ήταν προηγουμένως ενεργός μεταβαίνει αυτόματα σε κατάσταση Zombie εάν αποκρίνεται και είναι ορατός από την προώθηση αναμονής. Στην κατάσταση Zombie, οι υπηρεσίες ρύθμισης παραμέτρων διαχείρισης αποκλείονται και οποιαδήποτε επαφή από Edge και πύλες που δεν έχουν μεταβεί στο νέο ενεργό SD-WAN Orchestrator ανακατευθύνονται στον προβιβασμένο διακομιστή.

καταστροφή-αποκατάσταση-αντίγραφο-και-κατάσταση

Ρύθμιση αντιγραφής SD-WAN Orchestrator

Απαιτούνται δύο εγκατεστημένες παρουσίες του SD-WAN Orchestrator για την εκκίνηση της αντιγραφής.

  • Η επιλεγμένη αναμονή τίθεται σε κατάσταση STANDBY_CANDIDATE, επιτρέποντάς της να διαμορφωθεί από τον ενεργό διακομιστή.
  • Στη συνέχεια, δίνεται στον ενεργό διακομιστή η διεύθυνση και τα διαπιστευτήρια της αναμονής και μεταβαίνει στην κατάσταση ACTIVE_CONFIGURING.
Όταν η κατάσταση STANDBY_CONFIG_RQST ορίζεται από την επιλογή «ενεργή» στην επιλογή «σε αναμονή», οι δύο διακομιστές συγχρονίζονται μέσω των μεταβάσεων κατάστασης.
Τα δύο Orchestrator στα οποία πρέπει να εδραιωθεί η αποκατάσταση καταστροφών (DR) πρέπει να έχουν την ίδια ώρα. Πριν ξεκινήσετε την αντιγραφή του SD-WAN Orchestrator, βεβαιωθείτε ότι έχετε ελέγξει τις ακόλουθες διαμορφώσεις NTP:
  • Η ζώνη ώρας πύλης πρέπει να οριστεί σε Etc/UTC. Χρησιμοποιήστε την ακόλουθη εντολή για να προβάλετε τη ζώνη ώρας NTP.
    vcadmin@vcg1-example:~$ cat /etc/timezone
    Etc/UTC
    vcadmin@vcg1-example:~$ 
    

    Εάν η ζώνη ώρας δεν είναι σωστή, χρησιμοποιήστε τις ακόλουθες εντολές για να ενημερώσετε τη ζώνη ώρας.

    echo "Etc/UTC" | sudo tee /etc/timezone
    sudo dpkg-reconfigure --frontend noninteractive tzdata
    
  • Η μετατόπιση NTP πρέπει να είναι μικρότερη ή ίση με 15 χιλιοστά του δευτερολέπτου. Χρησιμοποιήστε την ακόλουθη εντολή για να προβάλετε τη μετατόπιση NTP.
    sudo ntpqvcadmin@vcg1-example:~$ sudo ntpq -p
         remote           refid      st t when poll reach   delay   offset  jitter
    ==============================================================================
    *ntp1-us1.prod.v 74.120.81.219    3 u  474 1024  377   10.171   -1.183   1.033
     ntp1-eu1-old.pr .INIT.          16 u    - 1024    0    0.000    0.000   0.000
    vcadmin@vcg1-example:~$ 
    

    Εάν η μετατόπιση είναι εσφαλμένη, χρησιμοποιήστε τις ακόλουθες εντολές για να ενημερώσετε τη μετατόπιση NTP.

    sudo systemctl stop ntp
    sudo ntpdate <server>
    sudo systemctl start ntp
  • Από προεπιλογή, διαμορφώνεται μια λίστα διακομιστών NTP στο αρχείο /etc/ntpd.conf. Τα Orchestrator στα οποία πρέπει να εδραιωθεί το DR πρέπει να έχουν Internet για να έχουν πρόσβαση στους προεπιλεγμένους διακομιστές NTP και να διασφαλίζουν ότι η ώρα είναι συγχρονισμένη και στα δύο Orchestrator. Οι πελάτες μπορούν επίσης να χρησιμοποιήσουν τον τοπικό διακομιστή NTP που εκτελείται στο περιβάλλον τους για να συγχρονίσουν την ώρα.

Ρύθμιση Orchestrator σε αναμονή

Για να ρυθμίσετε το SD-WAN Orchestrator σε αναμονή, εκτελέστε τα παρακάτω βήματα:

  1. Στην πύλη χειριστή, κάντε κλικ στην καρτέλα Orchestrator και, στη συνέχεια, από το αριστερό τμήμα παραθύρου, κάντε κλικ στο κουμπί Αντιγραφή (Replication) για να εμφανίσετε την οθόνη Αντιγραφή Orchestrator (Orchestrator Replication).
  2. Ενεργοποιήστε το Orchestrator σε αναμονή επιλέγοντας το κουμπί επιλογής Αναμονή (Standby) [Ρόλος αντιγραφής (Replication Role)].
  3. Κάντε κλικ στο κουμπί Ενεργοποίηση για αναμονή (Enable for Standby).

    Εμφανίζεται η σελίδα Orchestrator σε αναμονή (Standby Orchestrator).

  4. Εισαγάγετε τις παραμέτρους για χειροκίνητη διαμόρφωση (manual configuration) και κάντε κλικ στο κουμπί Ενημέρωση πληροφοριών διαμόρφωσης (Update configuration info).

    Μετά τη διαμόρφωση του Orchestrator σε αναμονή για αντιγραφή, διαμορφώστε το ενεργό Orchestrator σύμφωνα με τις παρακάτω οδηγίες.

Ρύθμιση του ενεργού Orchestrator

Για να ρυθμίσετε το ενεργό SD-WAN Orchestrator, επιλέξτε τον ρόλο αντιγραφής ως ενεργό και ρυθμίστε τις παραμέτρους των εξής:

Επιλογή Περιγραφή
Επιλογή ρόλου αντιγραφής (Select Replication Role) Επιλέξτε το κουμπί επιλογής Ενεργό (Active) για τον ρόλο αντιγραφής.
Διεύθυνση Orchestrator σε αναμονή (Standby Orchestrator Address) Εισαγάγετε την πρωτεύουσα διεύθυνση IP του Orchestrator σε αναμονή.
Διεύθυνση Orchestrator σε αναμονή (Ipv6) [Standby Orchestrator Address (IPv6)] Εισαγάγετε τη διεύθυνση IPv6 του Orchestrator σε αναμονή.
Δευτερεύουσα διεύθυνση Orchestrator σε αναμονή (Standby Orchestrator Secondary Address) Εισαγάγετε τη διεύθυνση της δευτερεύουσας διασύνδεσης του Orchestrator σε αναμονή. Αυτή η διεύθυνση χρησιμοποιείται για αντιγραφή, εάν η κατάσταση αναμονής έχει αναβαθμιστεί σε ενεργή. Οι χρήστες μπορούν να προσθέσουν διεύθυνση Ipv4/Ipv6 ή FQDN εδώ.
UUID Orchestrator σε αναμονή (UUID Orchestrator σε αναμονή) Εισαγάγετε το UUID του Orchestrator σε αναμονή.
Λειτουργία διαμόρφωσης (Configuration Mode) Επιλέξτε το κουμπί επιλογής Αυτόματη διαμόρφωση αναμονής (Auto Configure Standby) ή Χειροκίνητη διαμόρφωση αναμονής (Manually Configure Standby), ανάλογα με την απαίτηση.

Όταν τη διαμορφώνετε χειροκίνητα, επικολλήστε μια τιμή συμβολοσειράς από ACTIVE VCO σε STANDBY_WAIT

.
Όνομα χρήστη υπερχρήστη (Superuser Username) Εισαγάγετε το εμφανιζόμενο όνομα για τον υπερχρήστη Orchestrator.
Κωδικός πρόσβασης υπερχρήστη Orchestrator σε αναμονή (Standby Orchestrator Superuser Password) Εισαγάγετε τον κωδικό πρόσβασης για τον υπερχρήστη Orchestrator.
  1. Κάντε κλικ στο κουμπί Ενεργοποίηση για ενεργό για να ενεργοποιήσετε τον ρόλο αντιγραφής.

Όταν ολοκληρωθεί η διαμόρφωση, και τα δύο Orchestrator (σε αναμονή και ενεργό) συγχρονίζονται.

Orchestrator σε αναμονή σε συγχρονισμό

Ενεργό Orchestrator σε συγχρονισμό

Δοκιμή ανακατεύθυνσης

Τα ακόλουθα σενάρια δοκιμής ανακατεύθυνσης είναι αναγκαστικές ανακατευθύνσεις για χρήση ως παραδείγματα. Μπορείτε να εκτελέσετε αυτές τις ενέργειες στην περιοχή Διαθέσιμες ενέργειες (Available Actions) των οθονών Ενεργό (Active) και Σε αναμονή (Standby).

Προώθηση Orchestrator σε αναμονή

Αυτή η ενότητα περιγράφει τον τρόπο προώθησης ενός Orchestrator σε αναμονή.

Για να προωθήσετε ένα Orchestrator σε αναμονή, εκτελέστε τα ακόλουθα βήματα:

  1. Κάντε κλικ στη σύνδεση Ξεκλείδωμα (Unlock).
  2. Κάντε κλικ στο κουμπί Προώθηση αναμονής (Promote Standby) στην περιοχή Διαθέσιμες ενέργειες (Available Actions) στην οθόνη «Orchestrator σε αναμονή».

    Εμφανίζεται το ακόλουθο παράθυρο διαλόγου, που υποδεικνύει ότι, όταν προωθείτε το Orchestrator σε αναμονή, οι διαχειριστές δεν θα μπορούν πλέον να διαχειρίζονται το SD-WAN Orchestrator χρησιμοποιώντας το Orchestrator που ήταν ενεργό προηγουμένως.

  3. Κάντε κλικ στο κουμπί Προώθηση αναμονής (Promote Standby) για την προώθηση του Orchestrator σε αναμονή.
  4. Κάντε κλικ στην επιλογή Επιβολή προαγωγής στοιχείου αναμονής (Force Promote Standby) για την προώθηση του Orchestrator.

    Εμφανίζεται ένα τελικό παράθυρο διαλόγου που υποδεικνύει ότι το Orchestrator δεν είναι πλέον σε κατάσταση αναμονής και επανεκκινείται σε αυτόνομη λειτουργία.

Όταν προωθείτε ένα Orchestrator σε αναμονή, επανεκκινείται σε αυτόνομη λειτουργία.

Αν το Orchestrator σε αναμονή μπορεί να επικοινωνήσει με το πρώην Ενεργό Orchestrator, δίνει οδηγία σε αυτό το Orchestrator να εισέλθει σε κατάσταση Zombie. Σε κατάσταση Zombie, το Orchestrator ενημερώνει τους πελάτες του (Edge, πύλες, περιβάλλον εργασίας χρήστη/API) ότι δεν είναι πλέον ενεργό και ότι πρέπει να επικοινωνούν με το Orchestrator που προωθήθηκε πρόσφατα. Εάν το Orchestrator σε αναμονή που προωθήθηκε δεν μπορεί να επικοινωνήσει με το πρώην ενεργό Orchestrator, ο χειριστής θα πρέπει, εάν είναι δυνατόν, να υποβιβάσει χειροκίνητα το πρώην ενεργό Orchestrator.

Επιστροφή σε μεμονωμένη λειτουργία

Για να επαναφέρετε το Zombie σε μεμονωμένη λειτουργία, κάντε κλικ στο κουμπί Επιστροφή σε μεμονωμένη λειτουργία (Return to Standalone Mode) στην περιοχή «Διαθέσιμες ενέργειες» (Available Actions) στις οθόνες Ενεργό Orchestrator (Active Orchestrator) ή Orchestrator σε αναμονή (Standby Orchestrator).

Σημείωση:

Το Orchestrator μπορεί να επιστρέψει στη μεμονωμένη λειτουργία από την κατάσταση Zombie μετά το χρονικό διάστημα που καθορίζεται στην ιδιότητα συστήματος «vco.disasterRecovery.zombie.expirySeconds», η προεπιλογή της οποίας είναι τα 1800 δευτερόλεπτα.

Αντιμετώπιση προβλημάτων ανάκτησης καταστροφών του SD-WAN Orchestrator

Αυτή η ενότητα περιγράφει τις καταστάσεις αποτυχίας του συστήματος. Αυτά παρατίθενται επίσης στο περιβάλλον εργασίας χρήστη, μαζί με μια πιο λεπτομερή περιγραφή της αποτυχίας. Στο αρχείο καταγραφής του VMware υπάρχουν πρόσθετες πληροφορίες.

Ανακτήσιμες αποτυχίες

Τα ακόλουθα σφάλματα είναι ανακτήσιμες αποτυχίες που μπορεί να προκύψουν αφού η ανάκτησης καταστροφών του SD-WAN Orchestrator φτάσει σε κατάσταση συγχρονισμού. Εάν διορθωθεί το πρόβλημα που προκαλεί αυτές τις αποτυχίες, η ανάκτηση καταστροφής του SD-WAN Orchestrator επανέρχεται αυτόματα σε κανονική λειτουργία.

  • FAILURE_SYNCING_FILES
  • FAILURE_GET_STANDBY_STATUS
  • FAILURE_MYSQL_ACTIVE_STATUS
  • FAILURE_MYSQL_STANDBY_STATUS

Μη ανακτήσιμες αποτυχίες

Οι ακόλουθες αποτυχίες μπορεί να προκύψουν κατά τη διαμόρφωση της ανάκτησης καταστροφών του SD-WAN Orchestrator. Η ανάκτηση καταστροφών του SD-WAN Orchestrator δεν ανακάμπτει αυτόματα από αυτές τις αποτυχίες.

  • FAILURE_ACTIVE_CONFIGURING
  • FAILURE_LAUNCHING_STANDBY
  • FAILURE_STANDBY_CONFIGURING
  • FAILURE_COPYING_DB
  • FAILURE_COPYING_FILES
  • FAILURE_SYNC_CONFIGURING
  • FAILURE_GET_STANDBY_CONFIG
  • FAILURE_STANDBY_CANDIDATE
  • FAILURE_STANDBY_UNCONFIG
  • FAILURE_STANDBY_PROMOTION
  • FAILURE_ACTIVE_DEMOTION