Tech Preview: Geführte Ursachenanalyse (Guided Root Cause Analysis, RCA) bei Lösungsvorfällen

Die geführte Ursachenanalyse in VMware Workspace ONE Intelligence unterstützt Sie beim Debuggen von weitverbreiteten Problemen mit Anwendungs- und Betriebssystemabstürzen. Verwenden Sie diese Funktion in Ihren Experience Management-Bereitstellungen (auch als DEEM bekannt), bei denen Sie eine starke, abnormale Zunahme der Abstürze bemerken.

Technische Vorschauen

Workspace ONE Intelligence bietet eine geführte Ursachenanalyse als Tech Previews. Tech Preview-Funktionen können in jeder Produktionsumgebung sicher ausgeführt werden, aber einige Funktionen funktionieren im Rahmen der Tech Preview-Funktion möglicherweise nicht wie erwartet. Allerdings helfen diese Previews Workspace ONE Intelligence, die aktuelle Funktionalität zu verbessern und zukünftige Verbesserungen zu entwickeln.

Anforderungen

  • Die geführte Ursachenanalyse funktioniert für Windows-Apps und -Geräte.
  • Die Funktion hilft bei der Analyse von Anwendungs- und Betriebssystemabstürzen (Systemabstürze).
  • Während der Tech Preview können Sie bis zu 50 Ursachenanalysen pro Monat ausführen.
  • Damit nach dem Ausführen der Ursachenanalyse die Ergebnisse angezeigt werden, muss der von Ihnen ausgewählte Datumsbereich für die Ursachenanalyse mindestens 100 App- oder Systemabstürze umfassen.
    • Wenn Sie eine Analyse für einen System- oder App-Absturz ausführen und keine Ergebnisse erhalten, bedeutet dies nicht, dass keine Abstürze aufgetreten sind. Es kann jedoch bedeuten, dass weniger als 100 Abstürze aufgetreten sind.
    • Sie können den Datumsbereich auf 7 Tage erweitern, um mindestens 100 Abstürze zu erhalten.
  • Informationen zum Erstellen von Workflows, die die Ergebnisse Ihrer Hauptursache standardisieren, finden Sie im Thema Konfigurieren von Workflows.

Wie verwenden Sie die geführte Ursachenanalyse (RCA)?

Verwenden Sie die Anleitung zur geführten Ursachenanalyse, um weitverbreitete App- und Systemabstürze auf Windows-Geräten zu debuggen. Es handelt sich um einen Algorithmus, der statistisch signifikante potenzielle Hauptursachen vorschlägt. Es ist nicht garantiert, dass der Algorithmus die Hauptursache jedes Mal findet. Er sollte Ihnen jedoch helfen, herauszufinden, wonach Sie während der Ursachenanalyse suchen müssen.

Verwenden Sie erweiterte Kriterien, um den RCA-Algorithmus zu optimieren

Sie können Erweiterte Kriterien verwenden, um den Algorithmus dabei zu unterstützen, mögliche Ursachen für Ihre Vorfälle zu finden. Auch wenn Sie im Abschnitt „Erweiterte Kriterien“ größere Werte für Lift-Wert oder Support auswählen, kann die Anzahl der Ergebnisse in der Analyselistenansicht verringert werden, aber auch die Anzahl der Ergebnisse, die nicht nützlich sind.

Das Optimieren der erweiterten Kriterienparameter ist optional, wird aber für die Bereitstellungen angeboten, bei denen der Ursachenanalysealgorithmus genau gesteuert werden soll.

Im Abschnitt Erweiterte Kriterien listet die Benutzeroberfläche die Funktionen auf, die Ihre konfigurierte Ursachenanalyse prüft. Berücksichtigen Sie die Funktionen, wenn Sie die erweiterten Kriterienparameter optimieren.

Erweitern Sie den Abschnitt „Erweiterte Kriterien“, um die Funktionen zu finden, nach denen der Algorithmus sucht.

Erläuterungen zu erweiterten Kriterienparametern

  • Lift-Wert: Ein Lift-Wert gibt an, wie stark sich der Algorithmus in statistischer Hinsicht auf die jeweilige Funktion verlässt (z. B. BS-Version oder Neu installierte Patches).
    • Wenn Sie den Lift-Wert erhöhen, zeigt der Algorithmus möglicherweise weniger Ergebnisse an, da er einen höheren Schwellenwert für das Vertrauen fordert, den ein Ergebnis erfüllen muss, damit es als aussagekräftig genug betrachtet wird, um angezeigt zu werden.
  • Musterlänge: Die Musterlänge bezieht sich auf die Anzahl der zugehörigen Funktionen, die der Algorithmus als möglicherweise zur Hauptursache beitragend identifiziert.
    • Wenn Sie 4 auswählen, zeigt der Algorithmus bis zu 4 Funktionen an (Funktionsbeispiele sind Gerätemodell, BS-Version, App-Version und Neu installierte Patches), die zusammen eine Hauptursache darstellen könnten.
    • Wenn Sie Muster anstelle einzelner Funktionen verwenden, können Sie komplexe Muster sehen, die Abstürze verursachen können, wie z. B. bestimmte Gerätemodelle, die nur abstürzen, wenn ein bestimmter Patch installiert wurde und eine bestimmte App-Version ausgeführt wird.
  • Support: Der Support-Wert ist der Prozentsatz der Abstürze mit einer bestimmten Funktion, der erforderlich ist, damit der Algorithmus sie als wichtig betrachtet und als Hauptursache auflistet.
    • Wenn Sie .05 auswählen, weist dies den Algorithmus an, eine wichtige Funktion zu berücksichtigen, wenn sie in 5 % oder mehr der Abstürze vorkommt.

Typen von geführten RCA-Metriken

Derzeit hilft die geführte RCA bei der Analyse von App- und Systemabstürzen. Jedes Gerät kann einen App-Absturz pro eindeutiger App und einen Systemabsturz pro Tag registrieren. Um den Algorithmus auszuführen, muss Ihre Bereitstellung während des Zeitfensters, das Sie beim Konfigurieren der geführten RCA auswählen, über 100 dieser eindeutigen Abstürze (101 spezifische App-Abstürze oder 101 Systemabstürze) erfahren.

Beispiel für geführte RCA-Konfigurationen

In diesem Beispiel wird beschrieben, wie Sie eine geführte RCA für eine fiktive App namens Acme Analytics konfigurieren, um zu ermitteln, warum die App abstürzt. Wir erläutern die Schritte von der Erstellung des Vorfalls bis zur Analyse der Hauptursachen in einem benutzerdefinierten Dashboard.

  1. Erstellen Sie einen Vorfall in Workspace ONE Intelligence.
    Sie müssen keinen Vorfall erstellen. Sie können einen Vorfall in der Liste auswählen, wie im nächsten Abschnitt des Beispiels erläutert.
    1. Navigieren Sie zu Workspace > Experience Management > Erfahrungsbewertung > Desktop-Apps > Anzeigen.
    2. Wählen Sie + Vorfall aus.
    3. Geben Sie den Namen der App, Acme Analytics, als den Namen des Vorfalls ein.
    4. Suchen Sie nach dem Namen der App (geben Sie Acme ein) und wählen Sie die App aus, um sie dem Vorfall als Objekt hinzuzufügen.
    5. Wählen Sie Vorfall erstellen aus.
  2. Überprüfen Sie die Leistungsindikatoren im Vorfall, nachdem einige Zeit vergangen ist.
    1. Navigieren Sie zu Workspace > Experience Management > Vorfälle und wählen Sie den Acme Analytics-Vorfall aus der Liste aus.
    2. Wählen Sie die Registerkarte Übersicht aus und navigieren Sie zum Abschnitt Leistungsindikatoren. Die Ereignisse App-Absturz und Anzahl der App-Abstürze zeigen einen Anstieg bei App-Abstürzen an. Der Vorfall „App-Absturz“ zeigt eine große Zunahme an Abstürzen an, und dieses Szenario ist ideal für die Verwendung geführter RCA.
  3. Arbeiten Sie auf der Registerkarte RCA des Vorfalls. Mithilfe der geführten RCA erstellen Sie eine App-Absturzdiagnose, mit der das System mögliche Ursachen für die Zunahme von Abstürzen finden kann.
    1. Navigieren Sie zu Workspace > Experience Management > Vorfälle und wählen Sie den Acme Analytics-Vorfall aus der Liste aus.
    2. Wählen Sie die Registerkarte RCA aus und geben Sie die Werte im Bereich Ursachenanalyse ein.
      • Metrik: Wählen Sie App-Absturz aus.
      • Von: Fügen Sie das Datum 09/12/2022 hinzu.
      • Bis: Fügen Sie das Datum 09/18/2022 hinzu.
      • Anwendung: Geben Sie Acme ein, um nach der App zu suchen, und wählen Sie die Acme Analytics-App aus der Ergebnisliste aus.
    3. Wählen Sie Analyse ausführen aus.
    4. Wählen Sie nach Abschluss der Analyse die Option Vollständigen Bericht anzeigen aus.
    5. Wechseln Sie zur Ergebnisübersicht, um eine Liste der Ergebnisse anzuzeigen, die mögliche Ursachen für den Anstieg bei Abstürzen der Acme Analytics-App identifizieren.
      • Suchen Sie nach Hauptursachen, die Sie weiter untersuchen möchten. Suchen Sie nach nützlichen Hauptursachen mit einer hohen Anzahl von Abstürzen. Je nach Konfiguration der geführten RCA und den verfügbaren Daten stuft das System die Hauptursachen unterschiedlich ein.
      • In diesem Beispiel arbeiten Sie mit zwei Typen in der Liste der Hauptursachen: App-Version und Patch. Obwohl diese Hauptursachen nicht in den oberen drei nützlichen Hauptursachen angezeigt werden, weisen sie die höchste Anzahl von Abstürzen in der Liste auf.
      • Die Beispiel-App-Version ist Acme Analytics-1.234.432.0 (11.01).
        • Sie ist Nummer 4 in der Liste der Hauptursachen.
        • Das System meldet 229 Abstürze.
        • Dies ist die höchste Anzahl von Abstürzen in der Liste der Hauptursachen.
      • Die Beispiel-Patchnummer ist 1ABCD23EFG4H-Acme.Analytics.
        • Sie ist Nummer 12 in der Liste der Hauptursachen.
        • Das System meldet 68 Abstürze.
        • Dies ist die zweithöchste Anzahl von Abstürzen in der Liste der Hauptursachen.
      • Sie können das Hauptursachenelement in der Liste auswählen, um zugehörige Ereignisse zu finden.
      • Verwenden Sie das Kontrollkästchen Nicht nützlich für ein Hauptursachenelement in der Liste, von dem Sie wissen, dass es die Abstürze nicht verursacht hat. Durch dieses Kontrollkästchen wird das Element aus der Liste entfernt.
  4. Erstellen Sie ein benutzerdefiniertes Dashboard, um zu analysieren, ob diese Ereignisse den Anstieg bei dem App-Abstürzen verursacht haben.
    1. Navigieren Sie zu Workspace > Experience Management > Vorfälle und wählen Sie den Vorfall Acme Analytics aus.
    2. Wählen Sie die Registerkarte Übersicht und wechseln Sie zum Abschnitt zugehörige Dashboards.
    3. Wählen Sie Benutzerdefiniertes Dashboard erstellen aus.
    4. Wählen Sie im Dashboard die Auslassungspunkte (…) und dann Widget hinzufügen aus.
    5. Wählen Sie Benutzerdefiniertes Widget hinzufügen aus.
      Fügen Sie Ihrem benutzerdefinierten Dashboard drei Widgets hinzu. Erstellen Sie zwei Widgets aus der Kategorie Mitarbeitererfahrung > Apps und erstellen Sie das andere Widget aus der Kategorie Mitarbeitererfahrung > BS-Updates.
    6. Erstellen Sie Widgets eins und zwei mithilfe der Optionen Kategorie in Mitarbeitererfahrung > Apps.
      1. Erstellen Sie das erste Widget mit Name > Anwendungsstart und Anwendungs-Vordergrund. Ihre Widget-Konfigurationen für die Abschnitte „Datenvisualisierung“ und „Filter“.
        • Datenvisualisierung: Verlauf ist die Standardeinstellung.
        • Diagrammtyp: Wählen Sie Vertikal aus.
        • Maßnahme: Wählen Sie Anzahl von Sonstige > Ereignis-ID aus.
        • Gruppieren nach: Wählen Sie Sonstige > App-Version aus.
        • Ergebnisse pro Gruppe: Geben Sie 10 ein.
        • Datumsbereich: Legen Sie für Benutzerdefiniert Start > 09/12/2022 00:00 und Ende > 09/18/2022 23:59 fest.
        • Frequenz: Wählen Sie 1 Tag aus.
        • Filter: Fügen Sie zwei Regeln hinzu.
          1. Sonstige > App-Name enthält Acme Analytics
          2. Sonstige > Ereignisname enthält Anwendungsstart und Anwendungs-Vordergrund
      2. Erstellen Sie das zweite Widget mit Name > App-Abstürze nach App-Version. Ihre Widget-Konfigurationen für die Abschnitte „Datenvisualisierung“ und „Filter“.
        • Datenvisualisierung: Verlauf ist die Standardeinstellung.
        • Diagrammtyp: Wählen Sie Vertikal aus.
        • Maßnahme: Wählen Sie Anzahl von Sonstige > Ereignis-ID aus.
        • Gruppieren nach: Wählen Sie Sonstige > App-Version aus.
        • Ergebnisse pro Gruppe: Geben Sie 10 ein.
        • Datumsbereich: Legen Sie für Benutzerdefiniert Start > 09/12/2022 00:00 und Ende > 09/18/2022 23:59 fest.
        • Frequenz: Wählen Sie 1 Tag aus.
        • Filter: Fügen Sie drei Regeln hinzu.
          1. Sonstige > App-Name enthält Acme Analytics
          2. Sonstige > Ereignisname enthält Anwendungsabsturz
          3. Sonstige > Ereignisstatus enthält abschließen
      3. Erstellen Sie das dritte Widget mithilfe der Optionen Kategorie in Mitarbeitererfahrung > BS-Updates.
        • Name: Geben Sie Problem-Patch ein. Ihre Widget-Konfigurationen für die Abschnitte „Datenvisualisierung“ und „Filter“.
        • Datenvisualisierung: Verlauf ist die Standardeinstellung.
        • Diagrammtyp: Wählen Sie Vertikal aus.
        • Maßnahme: Wählen Sie Eindeutige Zahl von Sonstige > Ereignis-ID aus.
        • Gruppieren nach: Wählen Sie Gerät > Gerätemodell aus.
        • Ergebnisse pro Gruppe: Geben Sie 10 ein.
        • Datumsbereich: Legen Sie für Benutzerdefiniert Start > 09/12/2022 00:00 und Ende > 09/18/2022 23:59 fest.
        • Frequenz: Wählen Sie 1 Tag aus.
        • Filter: Fügen Sie zwei Regeln hinzu.
          1. Sonstige > Titel enthält den Namen des Patches 1ABCD23EFG4H-Acme.Analytics
          2. Sonstige > Ereignisstatus enthält abschließen
    7. Filtern und zeigen Sie die Widgets in Ihrem benutzerdefinierten Dashboard an, um weiter zu analysieren, warum die Acme Analytics-App abgestürzt ist.
      • Filtern Sie das Widget Anwendungsstart und Anwendungs-Vordergrund nach der Anwendungsversion Acme Analytics-1.234.432.0 (11.01).
        Sie können beobachten, dass Benutzer diese Version der App am 14. September verwendet haben.
      • Filtern Sie das Widget App-Abstürze nach App-Version, um nur die App-Version Acme Analytics-1.234.432.0 (11.01) anzuzeigen.
        Sie können beobachten, dass diese App-Version die höchste Anzahl von Absturzereignissen meldet.
      • Überprüfen Sie das Widget Problem-Patch, das die Geräte identifiziert, die den 1ABCD23EFG4H-Acme.Analytics-Patch erhalten haben.
        Sie können beobachten, dass viele Geräte diesen Patch um den 14. September herum erhalten haben. Dieses Datum ist das Datum, an dem die App-Version Acme Analytics-1.234.432.0 (11.01) abgestürzt ist (wie vom Widget Anwendungsstart und Anwendungs-Vordergrund gemeldet).
      • Erwägen Sie eine mögliche Standardisierung des Rollbacks dieser Version der App, indem Sie die gepatchte Version von den Geräten entfernen.
    8. Standardisieren Sie die in der geführten RCA gefundenen Ergebnisse mithilfe von Workflows und verwenden Sie eine Aktion, um die gepatchte Version der App zu entfernen.
check-circle-line exclamation-circle-line close-line
Scroll to top icon