Use as guias Solução de problemas para identificar a causa raiz dos problemas que o sistema não resolve por recomendações de alerta ou análise simples.
Para solucionar os sintomas dos problemas de capacidade que estão ocorrendo no cluster e no sistema host e determinar quando esses problemas ocorreram, use as guias Solução de problemas para investigar o problema de memória.
Procedimento
- No menu à esquerda, clique em Ambiente (Environment) e, em seguida, clique em Navegador de objetos (Object Browser)>vSphere Hosts and Clusters e selecione o objeto. Por exemplo, EUA-Cluster.
- Clique na guia Alertas (Alerts) e revise os sintomas.
A guia
Sintomas (Symptoms) exibe os sintomas disparados no cluster selecionado. Você percebe que existem vários sintomas críticos.
- O tempo restante do recurso de cálculo do cluster com projetos confirmados é extremamente baixo
- O tempo restante do recurso de cálculo do cluster está criticamente baixo
- A capacidade restante está criticamente baixa
- Investigue os sintomas críticos.
- Aponte para cada sintoma crítico para identificar a métrica usada.
- Para visualizar apenas os sintomas que afetam o cluster, digite cluster na caixa de texto do filtro rápido.
Quando você aponta para
Cluster Compute Resource Time Remaining is critically low
, a métrica
Capacity|Time Remaining
é exibida. Você percebe que seu valor é menor ou igual a zero, o que fez com que o sintoma de capacidade disparasse e gerasse um alerta no USA-Cluster.
- Clique na guia Eventos > Linha do tempo (Events > Timeline) para revisar os sintomas, alertas e eventos acionados que ocorreram no USA-Cluster ao longo do tempo e identificar quando os problemas ocorreram.
- Clique no calendário e selecione Últimos 7 dias (Last 7 Days) como o intervalo.
Vários eventos aparecem em vermelho.
- Aponte para cada evento para visualizar os detalhes.
- Para exibir os eventos que ocorreram no centro de dados do cluster, clique em Exibir de (View From) e selecione Centro de dados (Datacenter).
Os eventos de aviso para o centro de dados aparecem em amarelo.
- Aponte para os eventos de aviso.
Você percebe que ocorreu uma violação de limite rígido no centro de dados no final da noite. A violação de limite rígido mostra que o valor da métrica Badge|Workload estava abaixo do valor aceitável e que a violação foi acionada.
- Para visualizar os objetos filhos afetados, clique em Exibir de (View From) e selecione Host System.
- Clique na guia Eventos (Events) para examinar as alterações que ocorreram no USA-Cluster e determinar se ocorreu uma alteração que contribuiu para a causa raiz do alerta ou outros problemas com o cluster.
- Revise o gráfico.
Ao analisar o gráfico, você pode determinar se um evento recorrente causou os erros. Cada evento indica que o sistema de arquivos guest está sem espaço em disco. Os objetos afetados aparecem no painel após o gráfico.
- Clique em cada triângulo vermelho para identificar o objeto afetado e realçá-lo nesse painel.
- Clique na guia Capacidade (Capacity) para avaliar os detalhes de capacidade e tempo restante.
- Clique na guia Todas as métricas (All Metrics) para avaliar os objetos em seu contexto na topologia do ambiente para ajudar a identificar a possível causa de um problema.
- Na visualização superior, selecione USA-Cluster.
- No painel de métricas, expanda e clique duas vezes em Capacidade restante (%).
O cálculo da Capacidade Restante (%) aparece no painel direito.
- No painel de métricas, expanda e clique duas vezes em Workload (%). O cálculo de Carga de trabalho (%) aparece no painel direito.
- Na barra de ferramentas, clique em Controles de data (Date Controls) e selecione Últimos 7 dias (Last 7 Days).
O gráfico de métrica indica que a capacidade do cluster permaneceu em um nível estável na última semana, mas que o cálculo Badge|Workload (%) exibe extremos de carga de trabalho.
Resultados
Você analisou os sintomas, a linha do tempo, os eventos e as métricas relacionados aos problemas no seu cluster. Por meio de sua análise, você determinou que a carga de trabalho pesada no cluster fez com que o cluster começasse a ficar sem capacidade.
O que Fazer Depois
Examine as visualizações Detalhes e os mapas de calor para interpretar as propriedades, as métricas e os alertas. Além disso, procure tendências e picos que ocorrem nos recursos para seus objetos, as distribuições de recursos entre seus objetos e mapas de dados. Você pode examinar o uso de vários tipos de objeto em seus objetos.
Examine as visualizações Detalhes e os mapas de calor para interpretar as propriedades, as métricas e os alertas. Além disso, para procurar tendências e picos que ocorrem nos recursos de seus objetos, as distribuições de recursos entre seus objetos e os mapas de dados. Você pode examinar o uso de vários tipos de objeto em seus objetos. Consulte Examinar os detalhes do ambiente.