Si un hôte échoue et que ses machines virtuelles doivent être redémarrées, vous pouvez contrôler l'ordre dans lequel cela se fait avec le paramètre de priorité de redémarrage des machines virtuelles. De même, vous pouvez configurer la réponse de vSphere HA lorsque des hôtes perdent la connectivité au réseau de gestion à d'autres hôtes en utilisant les paramètres de réponse d'isolation. D'autres facteurs sont également pris en compte lorsque vSphere HA redémarre une machine virtuelle après un échec.
Les paramètres suivants s'appliquent à toutes les machines virtuelles du cluster en cas d'échec ou d'isolation d'un hôte. Vous pouvez configurer des exceptions pour des machines virtuelles spécifiques. Reportez-vous à la section Personnaliser une machine virtuelle secondaire.
Réponse d'isolation de l'hôte
La réponse d'isolation d'hôte détermine les événements survenant lorsqu'un hôte d'un cluster vSphere HA perd ses connexions au réseau de gestion, mais continue à s'exécuter. Vous pouvez utiliser la réponse d'isolation afin que vSphere HA mette hors tension les machines virtuelles en cours d'exécution sur un hôte isolé et les redémarre sur un hôte non isolé. Les réponses d'isolation d'hôte exigent que l'état de surveillance de l'hôte soit activé. L'état de surveillance de l'hôte est désactivé. Les réponses d'isolation d'hôte sont également interrompues. Un hôte détermine qu'il est isolé lorsqu'il est incapable de communiquer avec les agents en cours d'exécution sur les autres hôtes et d'envoyer un ping à ses adresses d'isolation. L'hôte exécute ensuite sa réponse d'isolation. Les réponses sont Mettre hors tension et redémarrer les VM ou Arrêter et redémarrer les machines virtuelles. Vous pouvez personnaliser cette propriété pour des machines virtuelles individuelles.
Pour utiliser le paramètre Arrêter et redémarrer les machines virtuelles, vous devez installer VMware Tools dans le système d'exploitation invité de la machine virtuelle. L'arrêt de la machine virtuelle offre l'avantage de préserver son état. L'arrêt est préférable à la mise hors tension de la machine virtuelle qui ne prend pas en compte pas les dernières modifications apportées aux disques ni ne valide les transactions. Le basculement des machines virtuelles qui sont en train de s'arrêter est plus long car la fermeture doit aussi être effectuée. Les machines virtuelles qui n'ont pas été arrêtées au bout de 300 secondes ou du délai défini par l'option avancée das.isolationshutdowntimeout sont mises hors tension.
Lorsque vous avez créé un cluster vSphere HA, vous pouvez changer les paramètres par défaut du cluster relatifs à la priorité de redémarrage et à la réponse d'isolation de machines virtuelles spécifiques. Ces remplacements sont utiles pour les machines virtuelles qui sont utilisées pour des tâches spéciales. Par exemple, les machines virtuelles qui fournissent des services d'infrastructure, comme DNS ou DHCP, doivent éventuellement être mises sous tension avant d'autres machines virtuelles du cluster.
Une condition de split-brain peut se produire sur une machine virtuelle lorsqu'un hôte se retrouve isolé ou partitionné depuis un hôte principal qui ne peut pas communiquer avec lui à l'aide des banques de données des signaux de pulsation. Dans une telle situation, l'hôte principal n'est pas en mesure de déterminer si l'hôte est actif et le déclare inactif. L'hôte principal fait ensuite une tentative pour redémarrer les machines virtuelles qui s'exécutent sur l'hôte isolé ou partitionné. Cette tentative réussit si les machines virtuelles continuent de s'exécuter sur l'hôte isolé ou partitionné et celui-ci perd l'accès aux banques de données des machines virtuelles quand il s'est retrouvé isolé ou partitionné. Il existe alors une condition de split-brain, car la machine virtuelle se retrouve avec deux instances. Toutefois, seule une de ces instances est en mesure de lire ou d'écrire sur les disques virtuels de la machine virtuelle. VM Component Protection peut vous aider à empêcher cette condition de split-brain. Lorsque vous activez VMCP avec le paramètre intensif, il contrôle l'accessibilité de la banque de données sur les machines virtuelles sous tension et arrête celles qui perdent l'accès à leurs banques de données.
Pour résoudre ce problème, ESXi génère une question sur la machine virtuelle qui a perdu les verrouillages disque pour le moment où l'hôte quitte son état d'isolation et est dans l'impossibilité obtenir de nouveau les verrouillages disque. vSphere HA répond automatiquement à cette question ce qui permet à l'instance de la machine virtuelle qui a perdu les verrouillages disque de se mettre hors tension, laissant uniquement l'instance qui dispose des verrouillages disque.
Dépendances des machines virtuelles
Vous pouvez créer des dépendances entre les groupes de machines virtuelles. Pour cela, vous devez d'abord créer les groupes de VM dans vSphere Client en accédant à l'onglet Configurer du cluster et en sélectionnant Groupes de VM/Hôte. Une fois les groupes créés, vous pouvez créer des règles de redémarrage des dépendances entre les groupes en accédant à l'onglet Règles de VM/Hôte et en sélectionnant dans le menu déroulant Machines virtuelles vers machines virtuelles. Ces règles peuvent spécifier que certains groupes de VM ne peuvent pas être redémarrés tant que d'autres groupes spécifiés n'ont pas été démarrés en premier.
Facteurs pris en charge pour le redémarrage de la machine virtuelle
Après un échec, l'hôte principal du cluster fait une tentative de redémarrage des machines virtuelles concernées en identifiant un hôte susceptible de les mettre sous tension. Lors de la sélection de cet hôte, l'hôte principal tient compte d'un certain nombre de facteurs.
- Accessibilité des fichiers
- Avant le démarrage d'une machine virtuelle, ses fichiers doivent être accessibles depuis l'un des hôtes actif du cluster avec lequel l'hôte principal peut communiquer via le réseau.
- Machine virtuelle et compatibilité de l'hôte
- S'il existe des hôtes accessibles, la machine virtuelle doit être compatible avec au moins l'un d'entre eux. La compatibilité définie pour une machine virtuelle comprend l'effet de l'une des règles d'affinité machine virtuelle/hôte. Par exemple, si une règle permet à une machine virtuelle de s'exécuter sur deux hôtes, elle est prise en compte pour le placement sur ces deux hôtes.
- Réservations de ressources
- Parmi les hôtes sur lesquels la machine virtuelle peut s'exécuter, au moins un doit disposer d'une capacité non réservée suffisante pour satisfaire aux besoins de la mémoire de temps système de la machine virtuelle et aux réservations de ressources. Quatre types de réservations sont prises en compte : CPU, mémoire, vNIC et lecteur Flash virtuel. De plus, un nombre de ports réseau suffisant doit être disponible pour mettre sous tension la machine virtuelle.
- Limites d'hôtes
- En plus des réservations de ressources, une machine virtuelle ne peut être placée sur un hôte que si cela ne lui fait pas dépasser le nombre maximal de machines virtuelles autorisées ou de vCPU utilisés.
- Contraintes de la fonctionnalité
- Si l'option avancée qui a été définie nécessite que vSphere HA fasse respecter les règles d'affinité machine virtuelle/machine virtuelle, vSphere HA n'enfreint pas cette règle. De plus, vSphere HA n'enfreint pas les limites configurée pour chaque hôte pour les machines virtuelles Fault Tolerance.
Si aucun hôte ne répond aux considérations précédentes, l'hôte principal émet un événement indiquant qu'il ne dispose pas des ressources suffisantes pour que vSphere HA démarre la machine virtuelle et ressaiera une fois les conditions du cluster améliorées. Par exemple, si la machine virtuelle n'est pas accessible, l'hôte principal réessaie après une modification de l'accessibilité des fichiers.