Mit den Registerkarten zur Fehlerbehebung können Sie die Hauptursache von Problemen identifizieren, die durch die Warnungsempfehlungen oder eine einfache Analyse nicht behoben werden konnten.

Vorbereitungen

Verwenden Sie die Registerkarten „Analyse“, um Ihre Umgebung zu analysieren. Weitere Informationen hierzu finden Sie unter Analysieren des Zustands Ihrer Umgebung.

Warum und wann dieser Vorgang ausgeführt wird

Um mit der Fehlerbehebung der Symptome der Kapazitätsprobleme fortzufahren, die auf dem Cluster und dem Hostsystem auftreten, und zu ermitteln, wann diese Probleme aufgetreten sind, verwenden Sie die Registerkarten zur Fehlerbehebung. Dort können Sie das Arbeitsspeicherproblem weiter untersuchen.

Prozedur

  1. Klicken Sie auf Umgebung > vSphere-Hosts und -Cluster > USA-Cluster.
  2. Klicken Sie auf die Registerkarte Fehlerbehebung und überprüfen Sie die Symptome.

    Die Registerkarte Symptome zeigt die Symptome an, die auf dem ausgewählten Cluster ausgelöst wurden. Sie stellen fest, dass es mehrere kritische Symptome gibt.

    • Die verbleibende Zeit bei Clusterrechenressourcen mit festgelegten Projekten ist kritisch niedrig.

    • Die verbleibende Zeit bei Clusterrechenressourcen ist kritisch niedrig.

    • Verbleibende Kapazität ist kritisch niedrig.

  3. Analysieren Sie die kritischen Symptome.
    1. Bewegen Sie den Mauszeiger über jedes kritische Symptom, um die verwendete Metrik zu identifizieren.
    2. Um nur die Symptome anzuzeigen, die den Cluster beeinträchtigen, geben Sie Cluster in das Textfeld „Schnellfilter“ ein.

      Wenn Sie den Mauszeiger über Cluster Compute Resource Time Remaining is critically low bewegen, wird die Metrik Badge|Time Remaining with committed projects (%) angezeigt. Sie stellen fest, dass der Wert kleiner oder gleich 0 ist, was dazu führte, dass das Kapazitätssymptom ausgelöst und auf dem USA-Cluster eine Warnung generiert wurde.

  4. Klicken Sie auf die Registerkarte Zeitachse, um die ausgelösten Symptome, Warnungen und Ereignisse zu überprüfen, die über einen bestimmten Zeitraum hinweg auf dem USA-Cluster aufgetreten sind, und finden Sie heraus, wann die Probleme auftraten.
    1. Klicken Sie in der Symbolleiste auf Ereignistyp auswählen.
    2. Klicken Sie auf Datumssteuerelemente und wählen Sie Letzte 7 Tage.

      Mehrere Ereignisse werden rot dargestellt.

    3. Bewegen Sie den Mauszeiger über jedes Ereignis, um die Details anzuzeigen.
    4. Um die Ereignisse anzuzeigen, die im Datencenter des Clusters aufgetreten sind, klicken Sie auf Vorgängerereignisse anzeigen und wählen Sie Datacenter.

      Warnungsereignisse für das Datencenter werden gelb dargestellt.

    5. Bewegen Sie den Mauszeiger über die Warnungsereignisse.

      Sie erkennen, dass die Dichte niedriger wird und dass spät am Abend ein Verstoß gegen einen festen Schwellenwert aufgetreten ist. Der Verstoß gegen einen festen Schwellenwert zeigt, dass der Metrikwert für „Badge|Density“ unter dem akzeptierten Wert von 25 liegt und dass der Verstoß mit einem Wert von 14.89 ausgelöst wurde.

    6. Um die betroffenen untergeordneten Objekte anzuzeigen, klicken Sie auf Nachfolgeereignisse anzeigen und wählen Hostsystem.
  5. Klicken Sie auf die Registerkarte Ereignisse, um die Änderungen zu untersuchen, die im USA-Cluster aufgetreten sind, und um zu ermitteln, ob eine Änderung aufgetreten ist, die zur Hauptursache der Warnung oder zu anderen Problemen des Clusters beigetragen hat.
    1. Klicken Sie in der Symbolleiste auf jedes Badge und gehen Sie die aufgetretenen Ereignisse durch.

      Das Badge „Arbeitslast“ zeigt ein Diagramm der Ereignisse an, die im Cluster aufgetreten sind. Im Diagramm werden an verschiedenen Stellen mehrere rote Dreiecke angezeigt. Fehlerbehebung von Ereignissen für die Cluster-Arbeitslast

    2. Bewegen Sie den Mauszeiger über jedes der roten Dreiecke.

      Durch das Überprüfen des Diagramms können Sie herausfinden, ob ein wiederkehrendes Ereignis die Fehler verursacht hat. Alle Ereignisse zeigen an, dass das Gastdateisystem keinen freien Speicherplatz mehr hat. Die betroffenen Objekte werden in dem Bereich unter dem Diagramm angezeigt.

    3. Klicken Sie jeweils auf das rote Dreieck, um das betroffene Objekt zu identifizieren und es im Bereich darunter zu markieren.
  6. Klicken Sie auf die Registerkarte Alle Metriken und untersuchen Sie die Objekte in ihrem Kontext in der Umgebungstopologie, um die mögliche Ursache eines Problems zu identifizieren.
    1. Wählen Sie in der obersten Ansicht USA-Cluster.
    2. Erweitern Sie im Metrikenbereich Badge und doppelklicken Sie auf Badge|Verbleibende Kapazität (%).

      Die Berechnung „Badge|Verbleibende Kapazität (%)“ wird dem unteren rechten Bereich hinzugefügt.

    3. Doppelklicken Sie im Metrikenbereich auf Dichte.
    4. Doppelklicken Sie im Metrikenbereich auf Arbeitslast.
    5. Klicken Sie in der Symbolleiste auf Datumssteuerelemente und wählen Sie Letzte 7 Tage.

      Das Metrikdiagramm zeigt an, dass die Kapazität für den Cluster in der letzten Woche auf einem gleichbleibendem Level war, dass aber die Clusterdichte in den letzten Tagen den Maximalwert erreichte. Die Berechnung „Badge|Workload (%)“ zeigt für die Arbeitslast Extremwerte an, die zu dem Dichteproblem passen.

Ergebnisse

Sie haben die Symptome, die Zeitachse, die Ereignisse und die Metriken hinsichtlich der Probleme auf Ihrem Cluster analysiert und festgestellt, dass die hohe Arbeitslast auf dem Cluster in den letzten Tagen die Clusterdichte verringert hat, was darauf hindeutet, dass die Kapazität des Clusters bald erschöpft ist.

Nächste Maßnahme

Untersuchen Sie die Detailansichten und Heatmaps, um die Eigenschaften, Metriken und Warnungen zu interpretieren und nach Trends und Spitzenwerten zu suchen, die in den Ressourcen für die Objekte auftreten. Überprüfen Sie zudem die Verteilung der Ressourcen über die Objekte hinweg sowie die Datenzuordnungen, um die Nutzung der verschiedenen Ressourcentypen in allen Objekten zu untersuchen.