Sie können den gesamten vSAN-Cluster manuell herunterfahren, um eine Wartung oder Fehlerbehebung durchzuführen.

Verwenden Sie den Assistenten zum Herunterfahren von Clustern, es sei denn, Ihr Workflow erfordert ein manuelles Herunterfahren. Wenn Sie den vSAN-Cluster manuell herunterfahren, deaktivieren Sie vSAN auf dem Cluster nicht.

Hinweis: Wenn Sie mit einer vSphere with Tanzu-Umgebung arbeiten, müssen Sie beim Herunterfahren und Starten der Komponenten die angegebene Reihenfolge einhalten. Weitere Informationen finden Sie unter „Herunterfahren und Starten von VMware Cloud Foundation“ im VMware Cloud Foundation-Betriebshandbuch.

Prozedur

  1. Fahren Sie den vSAN-Cluster herunter.
    1. Überprüfen Sie den vSAN-Integritätsdienst, um zu bestätigen, dass der Cluster fehlerfrei ist.
    2. Schalten Sie alle im vSAN-Cluster ausgeführten virtuellen Maschinen (VMs) aus, wenn vCenter Server nicht im Cluster gehostet wird. Wenn vCenter Server im vSAN-Cluster gehostet wird, schalten Sie die vCenter Server-VM nicht aus.
    3. Klicken Sie auf die Registerkarte Konfigurieren und deaktivieren Sie HA. Dies führt dazu, dass der Cluster das Herunterfahren von Hosts nicht als Fehler registriert.

      Aktivieren Sie für vSphere 7.0 U1 und höher den vCLS-Retreat-Modus. Weitere Informationen finden Sie im VMware-Knowledgebase-Artikel unter https://kb.vmware.com/s/article/80472.

    4. Vergewissern Sie sich, dass alle Neusynchronisierungsaufgaben abgeschlossen sind.
      Klicken Sie auf die Registerkarte Überwachen und wählen Sie vSAN > Neusynchronisieren von Objekten aus.
    5. Wenn vCenter Server im vSAN-Cluster gehostet wird, schalten Sie die vCenter Server-VM aus.
      Notieren Sie sich den Host, auf dem die vCenter Server-VM ausgeführt wird. Dies ist der Host, auf dem Sie die vCenter Server-VM neu starten müssen.
    6. Deaktivieren Sie die Aktualisierung der Clustermitglieder von vCenter Server, indem Sie den folgenden Befehl auf den ESXi-Hosts im Cluster ausführen. Stellen Sie sicher, dass Sie den folgenden Befehl auf allen Hosts ausführen.
      esxcfg-advcfg -s 1 /VSAN/IgnoreClusterMemberListUpdates
    7. Anmelden bei einem beliebigen Host im Cluster außer dem Zeugenhost.
    8. Führen Sie den folgenden Befehl nur auf diesem Host aus. Wenn Sie den Befehl auf mehreren Hosts gleichzeitig ausführen, kann dies dazu führen, dass eine Race-Bedingung zu unerwarteten Ergebnissen führt.
      python /usr/lib/vmware/vsan/bin/reboot_helper.py prepare

      Der Befehl gibt Folgendes zurück und aus:

      Die Clustervorbereitung ist erfolgt.
      Hinweis:
      • Der Cluster ist nach dem erfolgreichen Abschluss des Befehls vollständig partitioniert.
      • Wenn ein Fehler auftritt, beheben Sie das Problem basierend auf der Fehlermeldung und versuchen Sie erneut, den vCLS-Retreat-Modus zu aktivieren.
      • Wenn im Cluster fehlerhafte oder getrennte Hosts vorhanden sind, entfernen Sie die Hosts und führen Sie die Ausführung des Befehls erneut aus.
    9. Versetzen Sie alle Hosts mit dem Modus Keine Aktion in den Wartungsmodus. Wenn der vCenter Server ausgeschaltet ist, verwenden Sie den folgenden Befehl, um die ESXi-Hosts mit dem Modus Keine Aktion in den Wartungsmodus zu versetzen.
      esxcli system maintenanceMode set -e true -m noAction
      Führen Sie diesen Schritt auf allen Hosts aus.
      Um das Risiko der Nichtverfügbarkeit von Daten zu vermeiden, wenn der Modus Keine Aktion gleichzeitig auf mehreren Hosts verwendet wird, gefolgt von einem Neustart mehrerer Hosts, lesen Sie den VMware-Knowledge-Base-Artikel unter https://kb.vmware.com/s/article/60424. Informationen zur Durchführung eines gleichzeitigen Neustarts aller Hosts im Cluster mithilfe eines integrierten Tools finden Sie im VMware-Knowledge-Base-Artikel unter https://kb.vmware.com/s/article/70650.
    10. Nachdem alle Hosts erfolgreich in den Wartungsmodus gelangt sind, führen Sie alle erforderlichen Wartungsaufgaben durch und schalten Sie die Hosts aus.
  2. Starten Sie den vSAN-Cluster neu.
    1. Schalten Sie die ESXi-Hosts ein.
      Schalten Sie die physische Box ein, in der ESXi installiert ist. Der ESXi-Host wird gestartet, sucht nach den VMs und arbeitet wie gewohnt.
      Wenn Hosts nicht neu gestartet werden können, müssen Sie die Hosts manuell wiederherstellen oder die ungültigen Hosts aus dem vSAN-Cluster verschieben.
    2. Wenn alle Hosts nach dem Einschalten wieder zurück sind, müssen Sie alle Hosts aus dem Wartungsmodus nehmen. Wenn der vCenter Server ausgeschaltet ist, verwenden Sie den folgenden Befehl auf den ESXi-Hosts, um den Wartungsmodus zu verlassen.
      esxcli system maintenanceMode set -e false
      Führen Sie diesen Schritt auf allen Hosts aus.
    3. Sie können sich bei einem der Hosts im Cluster mit einem anderen als dem Zeugenhost melden.
    4. Führen Sie den folgenden Befehl nur auf diesem Host aus. Wenn Sie den Befehl auf mehreren Hosts gleichzeitig ausführen, kann dies dazu führen, dass eine Race-Bedingung zu unerwarteten Ergebnissen führt.
      python /usr/lib/vmware/vsan/bin/reboot_helper.py recover

      Der Befehl gibt Folgendes zurück und aus:

      Neustart/Einschalten des Clusters wurde erfolgreich abgeschlossen.
    5. Stellen Sie sicher, dass alle Hosts im Cluster verfügbar sind, indem Sie auf jedem Host den folgenden Befehl ausführen.
      esxcli vsan cluster get
    6. Aktivieren Sie die Aktualisierung der Clustermitglieder von vCenter Server, indem Sie den folgenden Befehl auf den ESXi-Hosts im Cluster ausführen. Stellen Sie sicher, dass Sie den folgenden Befehl auf allen Hosts ausführen.
      esxcfg-advcfg -s 0 /VSAN/IgnoreClusterMemberListUpdates
    7. Starten Sie die vCenter Server-VM neu, wenn sie ausgeschaltet ist. Warten Sie, bis die vCenter Server-VM eingeschaltet ist und ausgeführt wird. Informationen zum Deaktivieren des vCLS-Retreat-Modus finden Sie im VMware-Knowledgebase-Artikel unter https://kb.vmware.com/s/article/80472.
    8. Stellen Sie erneut sicher, dass alle Hosts im vSAN-Cluster teilnehmen, indem Sie auf jedem Host den folgenden Befehl ausführen.
      esxcli vsan cluster get
    9. Starten Sie die restlichen VMs über vCenter Server neu.
    10. Überprüfen Sie den vSAN-Integritätsdienst und beheben Sie alle ausstehenden Probleme.
    11. (Optional) Wenn für den vSAN-Cluster vSphere-Verfügbarkeit aktiviert ist, müssen Sie vSphere-Verfügbarkeit manuell neu starten, um den folgenden Fehler zu vermeiden: vSphere HA-Primäragent nicht gefunden.
      Um vSphere-Verfügbarkeit manuell neu zu starten, wählen Sie den vSAN-Cluster aus und navigieren Sie zu:
      1. Konfigurieren > Dienste > vSphere-Verfügbarkeit > BEARBEITEN > vSphere HA deaktivieren
      2. Konfigurieren > Dienste > vSphere-Verfügbarkeit > BEARBEITEN > vSphere HA aktivieren
  3. Wenn im Cluster fehlerhafte oder getrennte Hosts vorhanden sind, müssen Sie die Hosts aus dem vSAN-Cluster wiederherstellen oder entfernen. Versuchen Sie, die obigen Befehle erst dann erneut zu verwenden, wenn der vSAN-Integritätsdienst alle verfügbaren Hosts im grünen Status zeigt.
    Wenn Sie einen vSAN-Cluster mit drei Knoten haben, kann der Befehl reboot_helper.py recover bei einem Ausfall eines Hosts nicht funktionieren. Gehen Sie als Administrator folgendermaßen vor:
    1. Entfernen Sie die Informationen des Fehlerhosts vorübergehend aus der Liste „Unicast-Agent“.
    2. Fügen Sie den Host hinzu, nachdem Sie den folgenden Befehl ausgeführt haben.
      reboot_helper.py recover
    Im Folgenden finden Sie die Befehle zum Entfernen und zum Hinzufügen des Hosts zu einem vSAN-Cluster:
    #esxcli vsan cluster unicastagent remove -a <IP Address> -t node -u <NodeUuid>
    #esxcli vsan cluster unicastagent add -t node -u <NodeUuid> -U true -a <IP Address> -p 12321