Lorsqu'un dispositif vRealize Automation dans une configuration à plusieurs nœuds et à haute disponibilité (HA) échoue, vous pouvez avoir besoin de remplacer le nœud défectueux.

Attention : Avant de poursuivre, VMware vous recommande de contacter le support technique afin de résoudre le problème lié à HA et de vérifier que le problème est isolé sur un nœud.

Si le support technique détermine que vous devez remplacer le nœud, prenez les mesures suivantes.

  1. Dans vCenter, prenez des snapshots de sauvegarde de chaque dispositif dans la configuration HA.

    Dans les snapshots de sauvegarde, n’incluez pas la mémoire de machine virtuelle.

  2. Arrêter le nœud défectueux.
  3. Notez le numéro de build du logiciel vRealize Automation sur le nœud défectueux et les paramètres réseau.

    Notez le nom de domaine complet, l'adresse IP, la passerelle, les serveurs DNS et particulièrement l'adresse MAC. Ensuite, attribuez les mêmes valeurs au nœud de remplacement.

  4. Vérifiez l'état du nœud de base de données principal. À partir d'une ligne de commande racine sur n'importe quel nœud sain, exécutez ce qui suit :
    > kubectl get pod `vracli status | jq -r '.databaseNodes[] | select(.["Role"] == "primary") | .["Node name"]' | cut -d '.' -f 1` -n prelude -o wide --no-headers=true
    
    primary-db-node-name 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
    Important : Le nœud de base de données principal doit être l'un des nœuds sains.

    Si le nœud principal de la base de données est défectueux, contactez le support technique au lieu de poursuivre.

  5. À partir de la ligne de commande racine du nœud sain, supprimez le nœud défectueux.

    vracli cluster remove faulty-node-FQDN

  6. Utilisez vCenter pour déployer un nouveau nœud vRealize Automation de remplacement.

    Déployez le même numéro de build du logiciel vRealize Automation et appliquez les paramètres réseau à partir du nœud défectueux. Incluez le nom de domaine complet, l'adresse IP, la passerelle, les serveurs DNS et particulièrement l'adresse MAC que vous avez notés précédemment.

  7. Mettez sous tension le nœud de remplacement.
  8. Connectez-vous en tant qu'utilisateur racine à la ligne de commande du nœud de remplacement.
  9. Vérifiez que la séquence de démarrage initiale s'est terminée en exécutant la commande suivante.

    vracli status first-boot

    Recherchez un message First boot complete.

  10. À partir du nœud de remplacement, joignez le cluster vRealize Automation.

    vracli cluster join primary-DB-node-FQDN

  11. Connectez-vous en tant qu'utilisateur racine à la ligne de commande du nœud de base de données principal.
  12. Déployez le cluster réparé en exécutant le script suivant.

    /opt/scripts/deploy.sh