Il existe plusieurs scénarios dans lesquels la machine virtuelle du serveur vSphere Bitfusion ne peut pas démarrer en raison de problèmes liés au GPU.

Problème

Lorsque vous mettez sous tension la machine virtuelle du serveur vSphere Bitfusion, celle-ci ne peut pas démarrer.

Cause

En général, les scénarios suivants se produisent pendant le processus d'installation d'un nouveau serveur vSphere Bitfusion.
  • Lorsque vous ajoutez plusieurs instances du même GPU à une machine virtuelle d'un serveur vSphere Bitfusion .
  • Lorsque la mémoire totale des GPU utilisés sur un serveur vSphere Bitfusion est supérieure à 128 Go.
  • Lorsque vous utilisez un GPU qui est déjà attribué à une autre machine virtuelle en cours d'exécution.

Solution

  • Si vous ajoutez les mêmes GPU plusieurs fois, vCenter Server ajoute le premier GPU plusieurs fois. Vous devez mettre à jour manuellement l'ID du bus PCI pour les GPU supplémentaires avec une valeur unique.
    1. Dans vSphere Client, cliquez avec le bouton droit sur la machine virtuelle du serveur vSphere Bitfusion, puis sélectionnez Modifier les paramètres.
    2. Dans le menu déroulant Périphérique PCI, sélectionnez un ID unique pour le GPU.
  • Si la mémoire totale des GPU utilisés sur un serveur vSphere Bitfusion unique est supérieure à 128 Go, vous devez modifier la valeur de la propriété pciPassthru.64bitMMIOSizeGB, qui est la propriété avancée de la machine virtuelle pour le relais de GPU.
    1. Calculez une valeur correcte pour la propriété. Comptez le nombre de périphériques PCI, tels que les GPU, qu'une machine virtuelle de serveur vSphere Bitfusion utilise, multipliez ce nombre par la taille du GPU en Go et arrondissez la valeur à la puissance deux suivante. Par exemple, pour utiliser le relais de GPU avec deux périphériques GPU de 16 Go, arrondissez la valeur à 64 (2 * 16 = 32 * 2 = 64). Pour un seul GPU de 16 Go, utilisez la valeur 32.
    2. Modifiez la propriété de machine virtuelle.
      1. Dans vSphere Client, sélectionnez la machine virtuelle du serveur vSphere Bitfusion et mettez-la hors tension.
      2. Lorsque la machine virtuelle est sélectionnée, sélectionnez Actions > Modifier les paramètres > Options de VM > Avancé > Modifier la configuration.
      3. Recherchez pciPassthru.64bitMMIOSizeGB et définissez une nouvelle valeur.
      4. Mettez la machine virtuelle sous tension.
  • Si le GPU que vous attribuez à une machine virtuelle d'un serveur vSphere Bitfusion est déjà attribué à un serveur en cours d'exécution, vous devez sélectionner un autre GPU. Vous pouvez avoir un seul relais entre un GPU et un serveur vSphere Bitfusion.