Pour garantir des performances optimales des clusters vSphere HA, vous devez suivre certaines meilleures pratiques. Cette rubrique met en évidence quelques-unes des meilleures pratiques essentielles pour un cluster vSphere HA. Vous pouvez également consulter la publication Meilleures pratiques du déploiement vSphere High Availability pour poursuivre la discussion.

Définir des alarmes pour surveiller les changements des clusters

Quand vSphere HA ou Fault Tolerance interviennent pour préserver la disponibilité en effectuant un basculement de machine virtuelle, par exemple, vous avez la possibilité d'être averti de ces changements. Dans vCenter Server, configurez des alarmes qui seront déclenchées lorsque ces actions surviendront, et recevez des alertes, sous forme de messages électroniques, par exemple, envoyées à un groupe d'administrateurs prédéfini.

Plusieurs alarmes par défaut sont disponibles pour vSphere HA.

  • Ressources de basculement insuffisantes (alarme de cluster)

  • Impossible de trouver le cluster principal (alarme du cluster)

  • Basculement en cours (alarme du cluster)

  • Statut de l'hôte HA (alarme d'hôte)

  • Erreur de surveillance de VM (alarme de machine virtuelle)

  • Action de surveillance de VM (alarme de machine virtuelle)

  • Échec du basculement (alarme de machine virtuelle)

Remarque :

Les alarmes par défaut contiennent le nom de la fonction, vSphere HA.

Surveillance de la validité du cluster

Un cluster valide est un cluster sur lequel il n'y eu aucune violation des stratégies de contrôle d'admission.

Un cluster sur lequel HA est activé devient invalide lorsque le nombre de machines virtuelles sous tension dépasse les exigences de basculement, ce qui signifie, que la capacité de basculement actuelle est inférieure à la capacité de basculement configurée. Si le contrôle d'admission est désactivé, les clusters ne deviennent pas non valides.

Dans vSphere Web Client, sélectionnez vSphere HA dans l'onglet Moniteur du cluster, puis sélectionnez Problèmes de configuration. La liste de problèmes actuels de vSphere HA apparaît.

Le comportement DRS n'est pas affecté par un cluster rouge à cause d'un problème lié à vSphere HA.

Interopérabilité de vSphere HA et de Storage vMotion dans un cluster mixte

Dans les clusters où des hôtes ESXi 5.x et ESX/ESXi 4.1 ou des hôtes antérieurs sont présents et où Storage vMotion est largement utilisé ou Storage DRS est activé, ne déployez pas vSphere HA. vSphere HA pourrait répondre à une défaillance de l'hôte en redémarrant une VM sur un hôte avec une version ESXi différente de celle sur laquelle la VM a été lancée avant la défaillance. Un problème peut survenir si, au moment de la défaillance, la machine virtuelle participait à une action de Storage vMotion sur un hôte ESXi 5.x, et si vSphere HA redémarre la VM sur un hôte ayant une version antérieure à ESXi 5.0. Pendant l'allumage de la machine virtuelle, des tentatives ultérieures d'opérations de snapshot pourraient corrompre l'état du vdisk et rendre la machine virtuelle inutilisable.

Pratiques d'excellence pour le contrôle d'admission

Les recommandations suivantes constituent les pratiques d'excellence pour le contrôle d'admission vSphere HA.

  • Sélectionnez la stratégie de contrôle d'admission Pourcentage de ressources de cluster réservées. Cette stratégie offre la plus grande flexibilité en termes de dimensionnement d'hôtes et de machines virtuelles. Lors de la configuration de cette stratégie, choisissez un pourcentage de CPU et de mémoire qui reflète le nombre de pannes que vous voulez que l'hôte prenne en charge. Par exemple, si vous voulez que vSphere HA réserve des ressources pour deux pannes et que vous avez dix hôtes d'une capacité égale dans le cluster, spécifiez 20 % (2/10).

  • Assurez-vous d'attribuer la même taille à tous les hôtes du cluster. Pour la stratégie Défaillances d'hôte tolérées par le cluster, un cluster non équilibré entraîne un excès de capacité réservé au traitement des pannes car vSphere HA réserve la capacité pour les hôtes les plus volumineux. Pour la stratégie Pourcentage de ressources du cluster, un cluster non équilibré nécessite que vous spécifiez des pourcentages plus élevés que nécessaire pour réserver une capacité suffisante en anticipation au nombre de pannes d'hôtes.

  • Si vous prévoyez d'utiliser la stratégie Défaillances d'hôte tolérées par le cluster, faites en sorte que les spécifications de dimensionnement des machines virtuelles soient similaires sur toutes les machines virtuelles configurées. Cette stratégie utilise des tailles d'emplacement pour calculer la capacité qui doit être réservée à chaque VM. La taille d'emplacement repose sur la plus grande mémoire et CPU réservées nécessaires à une machine virtuelle. Lorsque vous mélangez des machines virtuelles ayant des spécifications de CPU et de mémoire différentes, le calcul détermine la plus grande taille d'emplacement possible, ce qui limite la consolidation.

  • Si vous prévoyez d'utiliser la stratégie Définir les hôtes de basculement, indiquez le nombre de pannes d'hôtes à prendre en charge puis spécifiez ce nombre d'hôtes en tant qu'hôtes de basculement. Si le cluster n'est pas équilibré,, les hôtes de basculement désignés doivent être au moins de la même taille que les hôtes de non-basculement dans votre cluster. Cela garantit une capacité suffisante en cas de panne.

Utiliser Auto Deploy avec vSphere HA

Vous pouvez utiliser simultanément vSphere HA et Auto Deploy pour améliorer la disponibilité de vos machines virtuelles. Auto Deploy approvisionne les hôtes lorsqu'ils s'allument. Vous pouvez également le configurer pour installer l'agent vSphere HA sur ces hôtes pendant le processus de démarrage. Pour plus de détails, consultez la documentation d'Auto Deploy incluse dans le guide Installation et configuration de vSphere.

Mise à niveau d'hôtes dans un cluster à l'aide de Virtual SAN

Si vous mettez à niveau les hôtes ESXi dans votre cluster vSphere HA vers la version 5.5 ou une version ultérieure, et que vous prévoyez également d'utiliser Virtual SAN, suivez ce processus.

  1. Mettez à niveau tous les hôtes.

  2. Désactivez vSphere HA.

  3. Activez Virtual SAN.

  4. Réactivez vSphere HA.