La capacidad cuantifica los recursos utilizados, los recursos restantes y las oportunidades para recuperar los recursos no utilizados. Las proyecciones de la demanda proporcionan una vista proactiva de la capacidad. Los Paneles de control de capacidad muestran la capacidad en términos de tiempo restante antes de la previsión de agotamiento de capacidad, la capacidad restante, el número de máquinas virtuales que pueden caber en la capacidad restante y los recursos recuperables que pueden aumentar la capacidad disponible.
La administración de la capacidad está relacionada con la necesidad de equilibrar la demanda y el suministro. Se trata de poder hacer coincidir la demanda con el menor coste posible.
Para IaaS o DaaS, la administración de la capacidad comienza antes de que se implemente el hardware. Comienza con un plan de empresa que defina la clase de servicio que se proporcionará. Cada clase de servicio, por ejemplo, Gold, Silver o Bronze se diferencia por la calidad de servicio y cubre la disponibilidad, por ejemplo, 99,99 % del tiempo de actividad para Gold, 99,95 % del tiempo de actividad para Silver. También cubre el rendimiento, por ejemplo, una latencia de disco de 10 ms para Gold, 20 ms de latencia de disco para Silver y seguridad o conformidad.
La calidad se ve reflejada en el coste y, como consecuencia, en el precio. La máquina virtual de la clase Gold ofrece valores superiores por vCPU y por GB de RAM, ya que tiene una mayor calidad de servicio. Se debe planificar un modelo de precios adecuado. Si desea que los clientes puedan llevar a cabo la reestructuración por adelantado, una máquina virtual de 64 vCPU tiene que multiplicar por 64 el precio de una máquina virtual de una vCPU. Si el modelo de precios consiste en una simple línea recta, no habrá ningún incentivo a la hora de reducir el tamaño ni tampoco ningún tipo de penalización en el caso de estar sobreaprovisionado. En este caso, terminará forzando el redimensionamiento en la producción, lo cual es de hecho un proceso costoso y que requiere mucho tiempo.
- Demanda latente. Muchas máquinas virtuales críticas están protegidas mediante la recuperación ante desastres. Durante un simulacro de recuperación ante desastres o un desastre real, se consumirá esta carga.
- Demanda potencial. Muchas máquinas virtuales recién aprovisionadas tardan mucho en alcanzar su demanda prevista. El tiempo que tarda la base de datos en alcanzar el tamaño completo, la base de usuarios en alcanzar el destino y las funcionalidades en completarse. Una vez se logra, se produce un aumento de la demanda.
- La demanda no cumplida se produce cuando la máquina virtual o el pod de Kubernetes son insuficientes. La carga se está ejecutando casi al 100 % la mayor parte del tiempo.
- Una demanda excesiva puede causar un caos en un entorno compartido. Un grupo de máquinas virtuales con un valor de demanda muy exigente puede afectar de forma colectiva al rendimiento general del clúster o del almacén de datos.