Solucionar problemas com um sistema host

Use as guias Solução de problemas para identificar a causa raiz dos problemas que o sistema não resolve por recomendações de alerta ou análise simples.

Para solucionar os sintomas dos problemas de capacidade que estão ocorrendo no cluster e no sistema host e determinar quando esses problemas ocorreram, use as guias Solução de problemas para investigar o problema de memória.

Procedimento

No menu à esquerda, clique em Ambiente (Environment) e, em seguida, clique em Navegador de objetos (Object Browser)>vSphere Hosts and Clusters e selecione o objeto. Por exemplo, EUA-Cluster.
Clique na guia Alertas (Alerts) e revise os sintomas.
A guia Sintomas (Symptoms) exibe os sintomas disparados no cluster selecionado. Você percebe que existem vários sintomas críticos.
- O tempo restante do recurso de cálculo do cluster com projetos confirmados é extremamente baixo
- O tempo restante do recurso de cálculo do cluster está criticamente baixo
- A capacidade restante está criticamente baixa
Investigue os sintomas críticos.
1. Aponte para cada sintoma crítico para identificar a métrica usada.
2. Para visualizar apenas os sintomas que afetam o cluster, digite cluster na caixa de texto do filtro rápido.
  Quando você aponta para Cluster Compute Resource Time Remaining is critically low, a métrica Capacity|Time Remaining é exibida. Você percebe que seu valor é menor ou igual a zero, o que fez com que o sintoma de capacidade disparasse e gerasse um alerta no USA-Cluster.
Clique na guia Eventos > Linha do tempo (Events > Timeline) para revisar os sintomas, alertas e eventos acionados que ocorreram no USA-Cluster ao longo do tempo e identificar quando os problemas ocorreram.
1. Clique no calendário e selecione Últimos 7 dias (Last 7 Days) como o intervalo.
  Vários eventos aparecem em vermelho.
2. Aponte para cada evento para visualizar os detalhes.
3. Para exibir os eventos que ocorreram no centro de dados do cluster, clique em Exibir de (View From) e selecione Centro de dados (Datacenter).
  Os eventos de aviso para o centro de dados aparecem em amarelo.
4. Aponte para os eventos de aviso.
  Você percebe que ocorreu uma violação de limite rígido no centro de dados no final da noite. A violação de limite rígido mostra que o valor da métrica Badge|Workload estava abaixo do valor aceitável e que a violação foi acionada.
5. Para visualizar os objetos filhos afetados, clique em Exibir de (View From) e selecione Host System.
Clique na guia Eventos (Events) para examinar as alterações que ocorreram no USA-Cluster e determinar se ocorreu uma alteração que contribuiu para a causa raiz do alerta ou outros problemas com o cluster.
1. Revise o gráfico.
  Ao analisar o gráfico, você pode determinar se um evento recorrente causou os erros. Cada evento indica que o sistema de arquivos guest está sem espaço em disco. Os objetos afetados aparecem no painel após o gráfico.
2. Clique em cada triângulo vermelho para identificar o objeto afetado e realçá-lo nesse painel.
Clique na guia Capacidade (Capacity) para avaliar os detalhes de capacidade e tempo restante.
Clique na guia Todas as métricas (All Metrics) para avaliar os objetos em seu contexto na topologia do ambiente para ajudar a identificar a possível causa de um problema.
1. Na visualização superior, selecione USA-Cluster.
2. No painel de métricas, expanda Todas as métricas > Análise de capacidade gerada (All Metrics > Capacity Analyltics Generated) e clique duas vezes em Capacidade restante (%).
  O cálculo da Capacidade Restante (%) aparece no painel direito.
3. No painel de métricas, expanda All Metrics > Badge e clique duas vezes em Workload (%). O cálculo de Carga de trabalho (%) aparece no painel direito.
4. Na barra de ferramentas, clique em Controles de data (Date Controls) e selecione Últimos 7 dias (Last 7 Days).
  O gráfico de métrica indica que a capacidade do cluster permaneceu em um nível estável na última semana, mas que o cálculo Badge|Workload (%) exibe extremos de carga de trabalho.

Resultados

Você analisou os sintomas, a linha do tempo, os eventos e as métricas relacionados aos problemas no seu cluster. Por meio de sua análise, você determinou que a carga de trabalho pesada no cluster fez com que o cluster começasse a ficar sem capacidade.

O que Fazer Depois

Examine as visualizações Detalhes e os mapas de calor para interpretar as propriedades, as métricas e os alertas. Além disso, procure tendências e picos que ocorrem nos recursos para seus objetos, as distribuições de recursos entre seus objetos e mapas de dados. Você pode examinar o uso de vários tipos de objeto em seus objetos.

Examine as visualizações Detalhes e os mapas de calor para interpretar as propriedades, as métricas e os alertas. Além disso, para procurar tendências e picos que ocorrem nos recursos de seus objetos, as distribuições de recursos entre seus objetos e os mapas de dados. Você pode examinar o uso de vários tipos de objeto em seus objetos. Consulte Examinar os detalhes do ambiente.