Pour effectuer des opérations de dépannage ou de maintenance sur un serveur vSphere Bitfusion, vous devez supprimer le serveur du cluster vSphere Bitfusion.

Lors de la mise hors tension d'un serveur vSphere Bitfusion pour maintenance ou pour effectuer un dépannage, l'état de santé du cluster vSphere Bitfusion change. Lorsque le cluster n'est pas dans un état sain, vous ne pouvez pas ajouter de serveurs vSphere Bitfusion ni effectuer d'opération de sauvegarde de clusters. Si la moitié des serveurs ou plus est hors tension, le cluster est inopérable. Lors de la mise hors tension d'un serveur pour une durée plus longue, vous pouvez éliminer tout risque potentiel en supprimant le serveur du cluster.

L'exécution de la procédure suivante supprime immédiatement le serveur du cluster vSphere Bitfusion. Toutes les applications en cours d'exécution qui utilisent les GPU subissent immédiatement une panne de GPU et renvoient généralement une condition d'erreur.

Conditions préalables

  • Empêchez les nouvelles connexions de clients au serveur spécifique dans les paramètres du serveur.
  • Vérifiez qu'aucune application n'est en cours d'exécution sur le serveur.

Procédure

  1. Dans vSphere Client, sélectionnez Menu (icône de menu de vSphere Client) > Bitfusion.
  2. Dans l'onglet Serveurs, sélectionnez un serveur dans la liste.
  3. Dans le menu déroulant Actions, sélectionnez Supprimer.
  4. Dans la boîte de dialogue de confirmation, cliquez sur Supprimer.
    Le serveur vSphere Bitfusion n'est plus répertorié dans l'onglet Serveurs, mais l'opération de suppression peut prendre jusqu'à 10 minutes et plus. Pendant ce temps, la base de données Apache Cassandra est en cours de mise à jour.
  5. Vérifiez que l'opération de suppression est terminée .
    1. Ouvrez une application de terminal et exécutez ssh customer@ip_address, où ip_address est l'adresse IP d'un serveur vSphere Bitfusion actif.
      Vous pouvez obtenir l'adresse IP du serveur vSphere Bitfusion depuis le plug-in vSphere Bitfusion.
    2. Exécutez la commande nodetool status.
    3. Si le serveur vSphere Bitfusion supprimé s'affiche toujours dans la liste des serveurs, exécutez à nouveau la commande nodetool status jusqu'à ce que la sortie de la commande n'affiche plus le serveur supprimé.
  6. (Facultatif) Supprimez la machine virtuelle (VM) du serveur.
    La mise sous tension accidentelle de la VM supprimée peut entraîner le remplacement des informations de plug-in et de cluster de vSphere Bitfusion.

Résultats

Vous avez supprimé le serveur sélectionné du cluster vSphere Bitfusion.

Que faire ensuite

Pour réutiliser la machine virtuelle ou le matériel sous-jacent, vous pouvez effectuer l'une des tâches suivantes.
  • Si vous avez supprimé le serveur du cluster sans supprimer la machine virtuelle, supprimez le fichier de configuration /etc/bitfusion/bitfusion-manager.yaml sur la machine virtuelle, réactivez la machine virtuelle en tant que serveur vSphere Bitfusion, redémarrez le service vSphere Bitfusion, puis redémarrez la machine virtuelle. Pour plus d'informations, consultez Activation du client vSphere Bitfusion dans le Installation de VMware vSphere Bitfusion et Démarrage et arrêt du service vSphere Bitfusion.
  • Si vous avez supprimé la machine virtuelle du serveur, vous pouvez réutiliser le matériel sous-jacent en tant que serveur vSphere Bitfusion en créant une machine virtuelle et en déployant le dispositif du serveur vSphere Bitfusion. Reportez-vous à la section Installation des serveurs vSphere Bitfusion suivants.