Utilisez les onglets de l'espace de dépannage afin d'identifier la cause principale de problèmes ne pouvant être résolus par les recommandations des alertes ou par une analyse simple.

Avant de commencer

Utilisez les onglets de l'espace Analyse pour analyser votre environnement. Reportez-vous à Analyser l'état de votre environnement.

Pourquoi et quand exécuter cette tâche

Pour résoudre les symptômes des problèmes de capacité touchant le cluster et le système hôte, ainsi que pour déterminer le moment auquel ces problèmes sont survenus, utilisez les onglets de dépannage afin d'analyser le problème de mémoire plus en profondeur.

Procédure

  1. Cliquez sur Environnement > Hôtes et clusters vSphere > USA-Cluster.
  2. Cliquez sur l'onglet Dépannage et passez les symptômes en revue.

    L'onglet Symptômes affiche les symptômes qui se sont déclenchés sur le cluster sélectionné. Vous remarquez plusieurs symptômes critiques.

    • Le temps restant pour les ressources de calcul du cluster avec les projets validés est dangereusement faible

    • Le temps restant pour les ressources de calcul du cluster est dangereusement faible

    • La capacité restante est dangereusement faible

  3. Analysez les symptômes critiques.
    1. Passez votre souris sur chaque symptôme critique pour identifier la mesure utilisée.
    2. Pour afficher uniquement les symptômes qui touchent le cluster, entrez cluster dans la zone de texte de filtre rapide.

      Lorsque vous passez la souris sur Cluster Compute Resource Time Remaining is critically low, la mesure Badge|Time Remaining with committed projects (%) apparaît. Vous remarquez que sa valeur est inférieure ou égale à zéro, ce qui a déclenché le symptôme concernant la capacité et a généré une alerte sur le cluster USA-Cluster.

  4. Cliquez sur l'onglet Chronologie pour examiner les symptômes déclenchés, les alertes et les événements qui se sont produits sur USA-Cluster au fil du temps, ainsi que pour déterminer le moment où les problèmes sont survenus.
    1. Sur la barre d'outils, cliquez sur Sélectionner le type d'événement.
    2. Cliquez sur Contrôles de date et sélectionnez 7 derniers jours.

      Plusieurs événements apparaissent en rouge.

    3. Passez votre souris sur chaque événement pour en afficher les détails.
    4. Pour afficher les événements survenus sur le centre de données du cluster, cliquez sur Afficher les événements ancêtres et sélectionnez Centre de données.

      Les événements de type Avertissement concernant le centre de données apparaissent en jaune.

    5. Passez votre souris sur les événements de type Avertissement.

      Vous remarquez que la densité commence à être faible et qu'un seuil fixe a été dépassé sur le centre de données en fin de soirée. La violation du seuil fixe indique que la valeur de la mesure Badge|Densité était au-dessous de la valeur acceptable de 25 et que la violation a été déclenchée par une valeur de 14.89.

    6. Pour voir les objets enfants touchés, cliquez sur Afficher les événements des descendants et sélectionnez Système hôte.
  5. Cliquez sur l'onglet Événements pour examiner les changements survenus sur USA-Cluster et pour déterminer si l'un d'entre eux a contribué à la cause principale de l'alerte ou à d'autres problèmes sur le cluster.
    1. Sur la barre d'outils, cliquez sur chaque badge et affichez les événements survenus.

      Le badge Charge de travail affiche un graphique des événements survenus sur le cluster. Plusieurs triangles rouges apparaissent à divers points du graphique. Résolution d'événements pour la charge de travail du cluster

    2. Passez votre souris sur chaque triangle rouge.

      En examinant le graphique, vous pouvez déterminer si un événement récurrent est à l'origine des erreurs. Chaque événement indique que le système de fichiers invité est à court d'espace disque. Les objets touchés apparaissent dans le volet en dessous du graphique.

    3. Cliquez sur chaque triangle rouge pour identifier l'objet affecté et le mettre en surbrillance dans le volet ci-dessous.
  6. Cliquez sur l'onglet Toutes les mesures pour évaluer les objets en contexte dans la topologie de l'environnement afin de mieux identifier la cause possible d'un problème.
    1. Dans la vue supérieure, sélectionnez USA-Cluster.
    2. Dans le volet des mesures, développez Badge et cliquez deux fois sur Badge|Capacity Remaining (%).

      Le calcul Badge|Capacity Remaining (%) est ajouté au volet inférieur droit.

    3. Dans le volet des mesures, cliquez deux fois sur Densité.
    4. Dans le volet des mesures, cliquez deux fois sur Charge de travail.
    5. Sur la barre d'outils, cliquez sur Contrôles de date et sélectionnez 7 derniers jours.

      Le diagramme des mesures indique que la capacité du cluster est restée stable au cours de la semaine passée, mais que la densité du cluster a augmenté jusqu'à atteindre sa valeur maximale dans les derniers jours. Le calcul Badge|Workload (%) affiche les valeurs extrêmes de charge de travail qui correspondent au problème de densité.

Résultats

Vous avez analysé les symptômes, la chronologie, les événements et les mesures liés aux problèmes sur votre cluster. Vous avez ainsi déterminé que la lourde charge de travail sur le cluster a réduit la densité de celui-ci au cours des derniers jours, ce qui indique que le cluster arrive à court de capacité.

Que faire ensuite

Examinez les vues et les cartes thermiques de l'espace Détails pour identifier des tendances et des pics concernant les ressources de vos objets en interprétant les différentes propriétés, mesures et alertes. Vous pouvez également y consulter la répartition des ressources sur tous vos objets et utiliser des cartes de données pour examiner l'utilisation de divers types de ressources sur tous vos objets.