O painel vSANContenção é o painel principal para gerenciar o desempenho do vSAN. O administrador ou arquiteto do VMware pode usá-lo para monitorar e solucionar problemas de desempenho do cluster do vSAN. Se você determinar que há um problema de desempenho, use o painel vSANUtilização para ver se a causa da contenção é a alta utilização.

Considerações de projeto

Para visualizar as considerações de design comuns entre todos os painéis de gerenciamento de desempenho, consulte o Painéis de desempenho.

O painel vSANContenção complementa a vSphereCapacidade do cluster e compartilha a mesma consideração de projeto. Ele se concentra no armazenamento e em vSAN métricas específicas e não repete o que já foi abordado. Ele não lista nenhum cluster que não seja vSAN.

Como usar o painel

  • vSAN Pico de latência da VM, vSAN Pico de CPU pronta, vSAN Pico de pacote descartado.
    • Revise os três gráficos de distribuição para obter uma visão geral de todo o desempenho de clusters vSAN.
    • O gráfico de latência de pico da VM vSAN mostra a distribuição da latência do disco experimentada por todas as VMs no cluster. Você deve esperar que a maioria das VMs experimente uma latência que corresponda às suas expectativas. Por exemplo, em um sistema totalmente flash, as VMs não devem ter latência de disco >20 ms. Se o seu ambiente vSAN for totalmente flash, você deverá ajustar o bucket de distribuição para um conjunto mais rigoroso.
    • O gráfico de pico de CPU pronta vSAN mostra se algum dos módulos de kernel vSAN precisa aguardar a CPU. Espere que esse número seja próximo de 0% e abaixo de 1%, pois vSAN não deve aguardar o tempo de CPU. vSAN tem prioridade mais alta do que VM World, pois reside no espaço do kernel.
    • O gráfico de pico de pacote descartado vSAN mostra se algum dos clusters vSAN está descartando pacote na rede vSAN (não na rede da VM). vSAN depende da rede para manter o cluster sincronizado. Esse número deve estar próximo de 0% e inferior a 1%.
  • vSAN Clusters.
    • Ela lista todos os clusters vSAN, classificados pelo menos desempenho.
    • Ele lista todos os hosts ESXi, classificados pelo pior desempenho nas últimas 24 horas. Se a tabela estiver toda verde, não será necessário analisar mais. O motivo pelo qual 24 horas é selecionada em vez de uma semana é que os problemas de desempenho superiores a 24 horas provavelmente serão irrelevantes.
    • Você pode alterar o período de tempo para o período de seu interesse. O número máximo é refletido de acordo.
  • Selecione um cluster vSAN na tabela de clusters vSAN.
    • Todos os gráficos de integridade mostram o KPI do cluster selecionado.
    • Se você estiver usando o SMART, os dois mapas de calor na parte inferior do painel fornecerão um aviso prévio.

Pontos a serem observados

  • Um cluster vSAN grande pode ter muitos componentes. Cada um desses componentes pode ter várias métricas de desempenho. O número total de KPIs pode atingir centenas de métricas. Por exemplo, considere um cluster de 10 nós. Ele pode ter 530 contadores para verificar. VMware Aria Operations os agrega apresentando um conjunto de KPIs. Essa análise reduz o número para um número mais gerenciável. A tabela a seguir mostra os KPIs e suas fórmulas.
    Nome O que é
    Latência máxima do disco de capacidade (ms) A latência mais alta entre todos os discos de capacidade é a pior, não a média, pois a latência em um disco de capacidade única já é uma média de todas as suas VMs. Se houver 50 VMs no disco e 30 estiverem emitindo E/S nele, sua média estará entre 30.
    Mínimo de buffer de gravação do grupo de discos livre (%) Capacidade livre mais baixa entre todos os buffers de gravação do grupo de discos. Se esse número for baixo, um de seus buffers não é suficiente. Embora você queira maximizar seu cache, um número baixo é um aviso antecipado para o gerenciamento de capacidade.
    Latência máxima do buffer de gravação/cache de leitura do grupo de discos (ms) Cada disco tem uma Latência de Leitura de Cache de Leitura, Latência de Gravação de Cache de Leitura (para gravação no cache), Latência de Gravação de Buffer de Gravação e Latência de Leitura de Buffer de Gravação (para fins de remoção de preparação). Esse é o mais alto entre todos esses quatro números e o mais alto entre todos os grupos de discos. É o máximo do máximo porque cada um dos quatro pontos de dados é uma média de todas as VMs nele.
    Soma de Erros do Grupo de Discos Soma do reset do barramento + soma dos comandos cancelados entre todos os grupos de discos. Você deve usar sum e não obter o máximo, pois cada membro deve retornar zero.
    Contar congestionamento do grupo de discos acima de 60 O número de congestionamento de grupos de discos maior que 60. 60 está codificado no Pacote de Gerenciamento vSAN, pois é um bom ponto de partida. Como qualquer congestionamento acima de 60 serve um aviso prévio, conte quantas dessas ocorrências acontecem.
    Congestionamento máximo do grupo de discos O maior congestionamento entre todos os grupos de discos. Um número alto indica que pelo menos um grupo de discos não está funcionando.
    Capacidade mínima do grupo de discos livre (%) A menor capacidade livre entre todos os grupos de discos. Um espaço baixo aciona o rebalanceamento.
    Taxa mínima de acertos do cache de leitura do grupo de discos (%) A menor taxa de acertos entre o cache de leitura do grupo de discos. Certifique-se de que esse número seja alto, pois indica que a leitura é atendida pelo cache.
    Soma de vSAN pacotes de PortGroup descartados (%) Soma de todos os vSAN pacotes descartados RX da porta VMkernel + pacote descartado TX. Você não deve esperar nenhum pacote descartado em sua rede vSAN.