La restauración de un nodo de Automation Orchestrator puede causar problemas con el servicio de Kubernetes.

Para recuperar un nodo problemático en el clúster de Automation Orchestrator, debe ubicar el nodo, eliminarlo del clúster y, a continuación, volver a agregarlo al clúster.

Procedimiento

  1. Identifique el nodo principal del clúster de Automation Orchestrator.
    1. Inicie sesión en la línea de comandos de Automation Orchestrator Appliance de uno de sus nodos a través de SSH como root.
    2. Busque el nodo con la función primary ejecutando el comando kubectl -n prelude exec postgres-0.
      kubectl -n prelude exec postgres-0 – chpst -u postgres repmgr cluster show --terse --compact
    3. Recupere el nombre del pod en el que se encuentra el nodo principal.
      En la mayoría de los casos, el nombre del pod es postgres-0.postgres.prelude.svc.cluster.local.
    4. Busque la dirección FQDN del nodo principal ejecutando el comando kubectl -n prelude get pods.
      kubectl -n prelude get pods -o wide
    5. Busque el pod de la base de datos con el nombre que recuperó y obtenga la dirección FQDN para el nodo correspondiente.
  2. Localice el nodo problemático ejecutando el comandokubectl -n prelude get node.
    El nodo problemático tiene un estado de NotReady.
  3. Inicie sesión en la línea de comandos de Automation Orchestrator Appliance del nodo principal a través de SSH como raíz.
  4. Elimine el nodo problemático del clúster ejecutando el comando vracli cluster remove <NODE-FQDN>.
  5. Inicie sesión en la línea de comandos de Automation Orchestrator Appliance del nodo problemático a través de SSH como root.
  6. Vuelva a agregar el nodo al clúster ejecutando el comando vracli cluster join <MASTER-DB-NODE-FQDN>.