Sie können die Parameter der Systemdiagnose für Knoten in Tanzu Kubernetes Grid-Clustern über das UI-Plug-In Kubernetes Container Clusters konfigurieren, aktivieren und deaktivieren.

Die Funktion Systemdiagnose für Knoten besteht aus zwei Teilen:
  • Erkennung
  • Standardisierung
Hinweis: Systemdiagnose für Knoten und Automatische Reparatur bei Fehlern unterscheiden sich hinsichtlich ihrer Funktionalität. Die Systemdiagnose für Knoten erkennt und wartet fehlerhafte Knoten im Cluster erst nachdem der Cluster in den Status Verfügbar gewechselt hat. Die Automatische Reparatur bei Fehlern hingegen versucht erneut, einen Cluster zu erstellen, wenn der Cluster in einen fehlerhaften Zustand übergegangen ist, bevor der Clusterstatus Verfügbar wird.
Hinweis: Die Systemdiagnose für Knoten ist in VMware Cloud Director Container Service Extension 4.1 und neueren Versionen standardmäßig deaktiviert.

Erkennung von Knotenfehlern

VMware Cloud Director Container Service Extension 4.1 und neuere Versionen können erkennen, wenn ein Knoten in einem Tanzu Kubernetes Grid-Cluster fehlerhaft ist. Wenn sich ein Knoten in einem fehlerhaften Zustand befindet, gibt das UI-Plug-In Kubernetes Container Clusters die verfügbare und die gewünschte Knotenanzahl auf der Seite mit Clusterinformationen wieder. Der Fehler wird zudem im Abschnitt Ereignisse auf der gleichen Seite angezeigt.

Gründe für einen fehlerhaften Knoten können unter anderem die Folgenden sein:
  • Netzwerkausfälle
  • Unterbrechungen der Stromversorgung
  • Geringe Geschwindigkeit des Knotens aufgrund hoher Arbeitsspeicher-, CPU- oder Festplattenauslastung
  • Fehler beim Starten des Knotens
  • Fehler beim Hinzufügen zum Cluster

Knotenwartung

Ab VMware Cloud Director Container Service Extension 4.1 erkennt die Funktion Systemdiagnose für Knoten Knotenfehler in Tanzu Kubernetes Grid-Clustern und ersetzt automatisch fehlerhafte Kubernetes-Knoten durch neue Knoten. Die Parameter der „Systemdiagnose für Knoten“ sind erforderliche globale Einstellungen für die Einrichtung des VMware Cloud Director Container Service Extension-Servers und für Workflows für Server-Updates, die vom UI-Plug-In Kubernetes Container Clusters zum Erstellen von Clustern oder zum Aktualisieren von Einstellungen für Cluster in allen Organisationen verwendet werden. Weitere Informationen finden Sie unter Aktualisieren des VMware Cloud Director Container Service Extension-Servers. Dienstanbieter können jederzeit zur Registerkarte Server aktualisieren zurückkehren, um die Parameter der Systemdiagnose für Knoten neu zu konfigurieren. Wenn Dienstanbieter die Parameter der Systemdiagnose für Knoten nicht speziell konfigurieren, werden die folgenden Standardwerte festgelegt:
Tabelle 1. Konfiguration der Systemdiagnose für Knoten
Parameter der Systemdiagnose für Knoten Standardwert Beschreibung
Maximale Anzahl fehlerhafter Knoten 100 %

Die Wartung wird angehalten, wenn der Prozentsatz der fehlerhaften Knoten diesen Wert überschreitet. Wenn der Standardwert 100 % ist, bedeutet dies, dass der Cluster immer gewartet wird. Wenn der Standardwert 0 % ist, bedeutet dies, dass der Cluster nicht gewartet wird.

Zeitüberschreitung für Knotenstart 900 Sekunden

Wenn ein Knoten nicht innerhalb dieses Zeitraums gestartet wird, gilt er als fehlerhaft und wird gewartet. Für eine bestimmte VMware Cloud Director-Umgebung wird Dienstanbietern den Parameter der Systemdiagnose für Knoten auf einen Wert festzulegen, der mindestens doppelt so hoch ist wie die Zeit, die für die Erstellung und das Bootstrapping einer VM benötigt wird.

Zeitüberschreitung für Knoten mit dem Status „Nicht bereit“ 300 Sekunden Wenn ein neu hinzugefügter Knoten Arbeitslasten nicht länger als diesen Zeitüberschreitungswert hosten kann, wird er als fehlerhaft betrachtet und gewartet.
Zeitüberschreitung für Knoten mit dem Status „Unbekannt“ 300 Sekunden Wenn ein fehlerfreier Knoten länger als dieser Zeitüberschreitungswert erreichbar ist, wird er als fehlerhaft betrachtet und standardisiert.
Mandantenbenutzer verwenden die Parameter der Systemdiagnose für Knoten, die vom Dienstanbieter für ihre Organisation beim Erstellen von Clustern festgelegt wurden. Weitere Informationen finden Sie unter Erstellen eines Tanzu Kubernetes Grid-Clusters.
Hinweis: Wenn Dienstanbieter die Parameter der Systemdiagnose für Knoten aktualisieren, werden die bestehenden Parameter der Systemdiagnose für Knoten in den Tanzu Kubernetes Grid-Clustern, die bereits bereitgestellt sind, nicht geändert.

Aktivieren oder Deaktivieren der Systemdiagnose für Knoten in einem VMware Cloud Director Container Service Extension 4.0.x-Cluster

Mandantenbenutzer können die Systemdiagnose für Knoten auch in Clustern aktivieren oder deaktivieren, die in VMware Cloud Director Container Service Extension 4.0.x erstellt wurden.

In den folgenden Schritten wird beschrieben, wie Mandantenbenutzer diese Aktion durchführen können:

  1. Melden Sie sich beim VMware Cloud Director-Portal an und wählen Sie in der oberen Navigationsleiste Mehr > Kubernetes-Containercluster aus.
  2. Klicken Sie auf den Namen des Clusters und auf der Seite mit Clusterinformationen auf Einstellungen.
  3. Aktivieren oder deaktivieren Sie die Umschaltfunktion Systemdiagnose für Knoten und klicken Sie auf Speichern.