Dashboard „vSAN-Konflikt“

Das Dashboard vSAN-Konflikt ist das primäre Dashboard für die Verwaltung der vSAN-Leistung. Der VMware Administrator oder -Architekt kann damit die Leistung des vSAN-Clusters überwachen und Probleme beheben. Wenn Sie feststellen, dass es ein Leistungsproblem gibt, verwenden Sie das Dashboard vSAN Nutzung, um festzustellen, ob die Ursache für den Konflikt eine geringe Nutzung ist.

Technische Erwägungen

Informationen zu den gemeinsamen technischen Erwägungen für alle Leistungsmanagement-Dashboards finden Sie unter Leistungs-Dashboards.

Das Dashboard vSAN-Konflikt ergänzt vSphere-Clusterkapazität und folgt den gleichen technischen Erwägungen. Sein Fokus liegt allerdings auf Speicher- und vSAN-spezifischen Metriken, und es dupliziert keine anderswo angezeigten Informationen. Es werden keine Nicht-vSAN-Cluster aufgeführt.

Verwendung des Dashboards

vSAN-Spitze – VM-Latenz, vSAN-Spitze – CPU bereit, vSAN-Spitze – verworfenes Paket.
- Überprüfen Sie die drei Verteilungsdiagramme, um einen Überblick über die Leistung aller vSAN-Cluster zu erhalten.
- Das vSAN-Spitzen-VM-Latenzdiagramm zeigt die Verteilung der Datenträgerlatenz aller VMs im Cluster. Sie sollten davon ausgehen, dass die meisten VMs eine Latenz aufweisen, die Ihren Erwartungen entspricht. Beispielsweise sollten die VMs in einem reinen Flash-System keine Datenträgerlatenz von > 20 ms aufweisen. Wenn Ihre vSAN-Umgebung eine reine Flash-Umgebung ist, müssen Sie den Verteiler-Bucket auf eine strengere Einstellung ändern.
- Das Diagramm „vSAN-Spitze – CPU bereit“ zeigt an, ob eines der vSAN-Kernel-Module auf die CPU warten muss. Es ist zu erwarten, dass diese Zahl nahe 0 % und unter 1 % liegt, da vSAN nicht auf CPU-Zeit warten sollte. vSAN erhält eine höhere Priorität als VM World, da es im Kernelspeicher liegt.
- Das Diagramm „vSAN-Spitze – Paketverlust“ zeigt, ob einer der vSAN-Cluster Pakete im vSAN-Netzwerk (nicht im VM-Netzwerk) verliert. vSAN ist auf das Netzwerk angewiesen, um die Synchronisierung des Clusters aufrechtzuerhalten. Diese Zahl sollte nahe 0 % und unter 1 % liegen.
vSAN-Cluster.
- Hier werden alle vSAN-Cluster aufgelistet, sortiert nach der geringsten Leistung.
- Hier werden alle ESXi-Hosts aufgelistet, sortiert nach der schlechtesten Leistung in den letzten 24 Stunden. Wenn in der Tabelle alles grün angezeigt wird, muss nicht weiter analysiert werden. Der Grund, warum 24 Stunden statt einer Woche gewählt wird, ist, dass Leistungsprobleme, die länger als 24 Stunden dauern, mit hoher Wahrscheinlichkeit irrelevant sind.
- Sie können den Zeitraum nach Bedarf ändern. Die maximale Anzahl wird entsprechend widergespiegelt.
Wählen Sie aus der Tabelle „vSAN-Cluster“ einen vSAN-Cluster aus.
- Alle Systemzustandsdiagramme zeigen die KPI des ausgewählten Clusters an.
- Wenn Sie SMART verwenden, bieten die beiden Heatmaps am unteren Rand des Dashboards eine Frühwarnfunktion.

Zu beachtende Punkte

Ein großer vSAN-Cluster kann über viele Komponenten verfügen. Jede dieser Komponenten kann über mehrere Leistungsmetriken verfügen. Die Gesamtzahl an KPIs kann Hunderte von Metriken erreichen. Nehmen Sie beispielsweise einen Cluster mit 10 Knoten an. Dieser kann über 530 Indikatoren zur Prüfung verfügen. VMware Aria Operations fasst diese in einem Satz von KPIs zusammen. Bei dieser Analyse wird die Anzahl auf eine überschaubarere Menge reduziert. Die folgende Tabelle zeigt die KPIs und deren Formel.


Name	Funktion
Maximale Latenz bei Kapazitätsdatenträgern (ms)	Die höchste Latenz unter allen Kapazitätsdatenträgern nimmt nicht den Durchschnitt, sondern den schlechtesten Wert an, da die Latenz eines einzigen Kapazitätsdatenträgers bereits den Durchschnitt aller seiner VMs darstellt. Wenn auf der Festplatte 50 VMs vorhanden sind und 30 davon E/A-Vorgänge durchführen, wird der Durchschnitt aus diesen 30 gebildet.
Minimaler freier Puffer für Schreibvorgänge der Datenträgergruppen (%)	Geringste freie Kapazität unter allen Datenträgergruppen-Schreibpuffern. Wenn diese Ziffer niedrig ist, reicht einer ihrer Puffer nicht aus. Sie sollten zwar Ihren Cache maximieren, doch eine niedrige Zahl stellt eine Frühwarnung für das Kapazitätsmanagement dar.
Maximale Datenträgergruppenlatenz Lesecache/Schreibpuffer (ms)	Jede Festplatte hat eine Lesecache-Leselatenz, eine Lesecache-Schreiblatenz (zum Schreiben in den Cache), eine Schreibpuffer-Schreiblatenz und eine Schreibpuffer-Leselatenz (zum Destaging). Dabei werden die höchste unter all diesen vier Zahlen und die höchste unter allen Datenträgergruppen verwendet. Es handelt sich um den Maximalwert des Maximums, da jeder der vier Datenpunkte der Durchschnitt aller VMs darauf ist.
Summe Datenträgergruppenfehler	Summe der Bus-Zurücksetzung + Summe der Befehle, die unter allen Datenträgergruppen abgebrochen wurden. Sie müssen die Summe verwenden und dürfen nicht das Maximum erhalten, da jedes Mitglied null zurückgeben sollte.
Datenträgergruppen-Überlastung über 60 zählen	Die Anzahl der Datenträgergruppen, deren Überlastung größer als 60 ist. 60 ist im vSAN Management Pack hartcodiert, da es ein guter Startpunkt ist. Da eine Überlastung über 60 eine Frühwarnung ausgibt, zählen Sie, wie viele solcher Vorkommnisse eintreten.
Maximale Datenträgergruppen-Überlastung	Die höchste Überlastung unter allen Datenträgergruppen. Eine hohe Anzahl zeigt an, dass mindestens eine Datenträgergruppe nicht funktioniert.
Minimale freie Datenträgergruppenkapazität (%)	Die niedrigste freie Kapazität unter allen Datenträgergruppen. Bei geringem Speicherplatz wird eine Neuverteilung ausgelöst.
Minimale Trefferrate beim Lesen des Cache der Datenträgergruppen (%)	Die niedrigste Trefferrate im Lesecache der Datenträgergruppe. Stellen Sie sicher, dass diese Zahl hoch ist, da sie anzeigt, dass die Lesevorgänge vom Cache bereitgestellt werden.
Summe verloren gegangener vSAN-Portgruppen-Pakete (%)	Summe verloren gegangener empfangener vSAN-VMkernel-Port-Pakete oder verloren gegangener gesendeter Pakete. Sie sollten kein verloren gegangenes Paket in Ihrem vSAN-Netzwerk erwarten.