Pour effectuer des opérations de dépannage ou de maintenance sur un serveur vSphere Bitfusion, vous devez supprimer le serveur du cluster vSphere Bitfusion.
Lors de la mise hors tension d'un serveur vSphere Bitfusion pour maintenance ou pour effectuer un dépannage, l'état de santé du cluster vSphere Bitfusion change. Lorsque le cluster n'est pas dans un état sain, vous ne pouvez pas ajouter de serveurs vSphere Bitfusion ni effectuer d'opération de sauvegarde de clusters. Si la moitié des serveurs ou plus est hors tension, le cluster est inopérable. Lors de la mise hors tension d'un serveur pour une durée plus longue, vous pouvez éliminer tout risque potentiel en supprimant le serveur du cluster.
L'exécution de la procédure suivante supprime immédiatement le serveur du cluster vSphere Bitfusion. Toutes les applications en cours d'exécution qui utilisent les GPU subissent immédiatement une panne de GPU et renvoient généralement une condition d'erreur.
Conditions préalables
- Empêchez les nouvelles connexions de clients au serveur spécifique dans les paramètres du serveur.
- Vérifiez qu'aucune application n'est en cours d'exécution sur le serveur.
Procédure
Résultats
Que faire ensuite
- Si vous avez supprimé le serveur du cluster sans supprimer la machine virtuelle, supprimez le fichier de configuration /etc/bitfusion/bitfusion-manager.yaml sur la machine virtuelle, réactivez la machine virtuelle en tant que serveur vSphere Bitfusion, redémarrez le service vSphere Bitfusion, puis redémarrez la machine virtuelle. Pour plus d'informations, consultez Activation du client vSphere Bitfusion dans le Installation de VMware vSphere Bitfusion et Démarrage et arrêt du service vSphere Bitfusion.
- Si vous avez supprimé la machine virtuelle du serveur, vous pouvez réutiliser le matériel sous-jacent en tant que serveur vSphere Bitfusion en créant une machine virtuelle et en déployant le dispositif du serveur vSphere Bitfusion. Reportez-vous à la section Installation des serveurs vSphere Bitfusion suivants.