Если в устройстве vRealize Automation, которое находится в конфигурации «несколько узлов, высокая доступность (HA)» происходит отказ, может потребоваться замена неисправного узла.

Осторожно!: Прежде чем продолжить, компания VMware рекомендует обратиться в службу технической поддержки, попросить устранить проблему с HA и убедиться, что неисправен только один узел.

Если техническая поддержка решит, что узел необходимо заменить, выполните следующие действия.

  1. В vCenter создайте моментальные снимки для резервного копирования каждого устройства в конфигурации HA.

    Не включайте в эти моментальные снимки для резервного копирования память виртуальной машины.

  2. Завершите работу неисправного узла.
  3. Запишите номер сборки программного обеспечения неисправного узла vRealize Automation и параметры сети.

    Запишите полное доменное имя, IP-адрес, шлюз, DNS-серверы и обязательно MAC-адрес. В дальнейшем эти значения нужно будет назначить сменному узлу.

  4. Основной узел базы данных должен быть исправен. Выполните следующие действия.
    1. а.Войдите в командную строку исправного узла как пользователь root.
    2. б.Определите имя основного узла базы данных с помощью следующей команды.

      vracli status | grep primary -B 1

      Результат должен быть похож на следующий пример, где postgres-1 — основной узел базы данных.

      "Conninfo":
      "host=postgres-1.postgres.prelude.svc.cluster.local
      dbname=repmgr-db user=repmgr-db passfile=/scratch/repmgr-db.cred
      connect_timeout=10",
      "Role": "primary",
    3. в.Убедитесь, что основной узел базы данных исправен, выполнив следующую команду.

      kubectl -n prelude get pods -o wide | grep postgres

      Результат должен быть похож на следующий пример, где postgres-1 указан в списке как работающий и исправный.

      postgres-1 1/1 Running 0 39h 12.123.2.14 vc-vm-224-84.company.com <none> <none>
      postgres-2 1/1 Running 0 39h 12.123.1.14 vc-vm-224-85.company.com <none> <none>
      Важно!: Если основной узел базы данных неисправен, обратитесь в службу технической поддержки перед продолжением процедуры.
  5. Используя командную строку исправного узла с правами пользователя root, удалите неисправный узел.

    vracli cluster remove полное-доменное-имя-неисправного-узла

  6. Используйте vCenter для развертывания нового сменного узла vRealize Automation.

    Разверните тот же номер сборки программного обеспечения vRealize Automation и примените параметры сети из неисправного узла. Введите полное доменное имя, IP-адрес, шлюз, DNS-серверы и обязательно MAC-адрес, записанные ранее.

  7. Включите сменный узел.
  8. Войдите в командную строку сменного узла как пользователь root.
  9. Убедитесь, что процесс начальной загрузки завершен, с помощью следующей команды.

    vracli status first-boot

    Найдите сообщение First boot complete.

  10. На сменном узле присоединитесь к кластеру vRealize Automation.

    vracli cluster join полное-доменное-имя-узла-основной-БД

  11. Войдите в командную строку основного узла базы данных как пользователь root.
  12. Разверните восстановленный кластер с помощью следующего сценария.

    /opt/scripts/deploy.sh