La capacité quantifie les ressources utilisées, les ressources restantes et les opportunités de récupération des ressources inutilisées. Les projections de la demande fournissent une vue proactive de la capacité. Les Tableaux de bord Capacité affichent la capacité en termes de temps restant avant l'épuisement prévu de la capacité, la quantité de capacité restante, le nombre de VM pouvant tenir dans la capacité restante et les ressources récupérables pouvant augmenter la capacité disponible.

La gestion de la capacité consiste à équilibrer la demande et l'approvisionnement. Il s'agit de répondre à la demande avec le coût le plus faible possible.

Pour IaaS ou DaaS, la gestion de la capacité commence avant le déploiement du matériel. Elle commence par un plan de développement qui définit la classe de service qui sera proposée. Chaque classe de service (par exemple, or, argent, bronze) est différenciée par la qualité de service et couvre la disponibilité, par exemple, 99,99 % de temps d'activité pour l'or ou 99,95 % pour l'argent. Elle couvre également les performances, par exemple, une latence de disque de 10 ms pour or, de 20 ms pour argent, ainsi que la sécurité et la conformité.

La qualité est à l'origine du coût et détermine les prix. Le coût de la VM or est plus élevé par vPCU et par Go de RAM car elle propose une qualité de service supérieure. Un modèle de tarification adéquat doit être prévu. Si vous souhaitez que vos clients réalisent un dimensionnement optimal à l'avance, une VM à 64 vCPU doit être supérieure à 64x le prix d'une VM à 1 vCPU. Si le modèle de tarification est une ligne rectiligne simple, il n'y a aucun encouragement à viser petit et aucune pénalité en cas de surprovisionnement. Dans ce cas, vous vous retrouvez à forcer le dimensionnement optimal en production, ce qui est un processus coûteux et fastidieux.

La demande est supérieure à la charge active qui consomme votre capacité. Étant donné que la capacité basée sur l'utilisation est incomplète, les principes affichés dans la figure suivante sont pris en compte. Principes de l'offre et la demande.
  • Demande latente. De nombreuses VM critiques sont protégées par une récupération d'urgence. Lors d'une simulation de récupération d'urgence ou d'un sinistre réel, cette charge est consommée.
  • Demande potentielle. Beaucoup de VM récemment provisionnées prennent du temps pour atteindre la demande attendue. Il faut un certain temps pour que la base de données atteigne sa taille complète, que la base d'utilisateur atteigne la cible et que les fonctionnalités se finalisent. Une fois ces éléments achevés, ils entraînent une augmentation de la demande.
  • La demande non satisfaite survient lorsque l'espace de la VM ou du Kubernetes est sous-dimensionné. La charge est exécutée à près de 100 % la majorité du temps.
  • Toute demande excessive peut perturber grandement un environnement partagé. Un groupe de VM hautement exigeantes peut avoir une incidence collective sur les performances globales du cluster ou de la banque de données.