A capacidade quantifica os recursos usados, os recursos restantes e as oportunidades para recuperar os recursos não utilizados. As projeções da demanda fornecem uma visão proativa da capacidade. Os Painéis de capacidade exibem a capacidade em termos de tempo restante antes que a capacidade seja projetada para se esgotar, a quantidade de capacidade restante, o número de VMs que podem caber na capacidade restante e os recursos recuperáveis que podem aumentar a capacidade disponível capacidade.
O gerenciamento de capacidade trata do equilíbrio entre demanda e oferta. Trata-se de atender à demanda com o menor custo possível.
Para IaaS ou DaaS, o gerenciamento de capacidade começa antes da implantação do hardware. Ele começa com um plano de negócios que define qual classe de serviço será fornecida. Cada classe de serviço, por exemplo, ouro, prata e bronze, é diferenciada pela qualidade do serviço e abrange a disponibilidade, por exemplo, 99,99% de tempo de atividade para Ouro, 99,95% de tempo de atividade para Prata. Ele também abrange o desempenho, por exemplo, latência de disco de 10 ms para Gold, latência de disco de 20 ms para Silver e segurança ou conformidade.
A qualidade incorre em custos e, por sua vez, impulsiona o preço. A Gold VM é mais alta por vCPU e por GB de RAM porque tem uma qualidade de serviço mais alta. Um modelo de precificação adequado deve ser planejado. Se você quiser que seus clientes façam o redimensionamento correto com antecedência, uma VM de 64 vCPU deverá custar mais de 64 vezes o preço de uma VM de 1 vCPU. Se o modelo de precificação for uma linha reta simples, não haverá incentivo para reduzir o tamanho e nenhuma penalidade se for provisionado em excesso. Nesse caso, você acaba forçando o redimensionamento correto na produção, o que é um processo caro e demorado.
- Demanda latente. Muitas VMs críticas são protegidas com a Recuperação de desastres. Durante um exercício de recuperação de desastres ou um desastre real, essa carga é consumida.
- Demanda potencial. Muitas VMs recém-provisionadas levam tempo para atingir a demanda esperada. Leva tempo para que o banco de dados atinja o tamanho máximo, a base de usuários atinja o destino e as funcionalidades sejam concluídas. Quando isso é alcançado, resulta no aumento da demanda.
- A demanda não atendida ocorre quando a VM ou o pod do Kubernetes é subdimensionado. A carga está sendo executada quase 100% na maior parte do tempo.
- A demanda excessiva pode causar estragos em um ambiente compartilhado. Um grupo de VMs altamente exigentes pode afetar coletivamente o desempenho geral do cluster ou do datastore.