有关对 manager-service-automatic-failover 命令进行故障排除的建议。

解决方案

  • manager-service-automatic-failover 命令失败或显示以下消息两分钟以上:IAAS_MANAGER_SERVICE_NODEID 节点上启用 Manager Service 自动故障切换模式 (Enabling Manager Service automatic failover mode on node: IAAS_MANAGER_SERVICE_NODEID)
    1. 使用用户名 host 和部署设备时输入的密码登录到 vRealize Automation 设备管理,网址为 https://va-hostname.domain.name:5480。

    2. 选择 vRA 设置 > 群集

    3. 确认管理代理服务正在所有 Manager Service 主机上运行。

    4. 确认所有 IaaS Manager Service 节点的上次连接时间均不超过 30 秒。

    如果您发现任何管理代理连接问题,请手动解决这些问题,然后重试该命令以启用 Manager Service 自动故障切换。

  • manager-service-automatic-failover 命令无法在 Manager Service 节点上启用故障切换。可以放心地重新运行该命令来修复此问题。
  • IaaS 部署中的某些 Manager Service 主机已启用故障切换,而其他主机尚未启用。IaaS 部署中的所有 Manager Service 主机必须都启用故障切换功能,否则部署将无法正常运行。要解决此问题,请执行以下操作之一:
    • 在所有 Manager Service 节点上禁用故障切换,改为使用手动故障切换方法。请一次在一个主机上运行故障切换。

    • 如果多次尝试后仍无法在某个 Manager Service 节点上启用该功能,请停止此节点上的 Windows VMware vCloud Automation Center 服务并将节点启动类型设置为“手动”,直到您解决此问题。

  • 使用 Python 验证每个 Manager Service 节点上都已启用故障切换。
    1. 使用 SSH 以 root 用户身份登录到主 vRealize Automation 设备节点。

    2. 运行 python /usr/lib/vcac/tools/vami/commands/manager-service-automatic-failover ENABLE

    3. 确认系统返回以下消息:已在节点 IAAS_MANAGER_SERVICE_NODEID 上启用 Manager Service 自动故障切换模式 (Enabling Manager Service automatic failover mode on node: IAAS_MANAGER_SERVICE_NODEID done)

  • 通过检查 Manager Service 配置文件来验证每个 Manager Service 节点上均已启用故障切换。
    1. 在 Manager Service 节点上打开命令提示符。

    2. 导航到 vRealize Automation 安装文件夹,然后打开位于 VMware\vCAC\Server\ManagerService.exe.config 的 Manager Service 配置文件。

    3. 确认 <appSettings> 部分存在以下元素。

      • <add key="FailoverModeEnabled" value="True" />

      • <add key="FailoverPingIntervalMilliseconds" value="30000" />

      • <add key="FailoverNodeState" value="active" />

      • <add key="FailoverMaxFailedDatabasePingAttepts" value="5" />

      • <add key="FailoverMaxFailedRepositoryPingAttepts" value="5" />

  • 确认 Windows VMware vCloud Automation Center 服务的状态为“已启动”且启动类型为“自动”。
  • 使用 Python 验证每个 Manager Service 节点上都已禁用故障切换。
    1. 使用 SSH 以 root 用户身份登录到主 vRealize Automation 设备节点。

    2. 运行 python /usr/lib/vcac/tools/vami/commands/manager-service-automatic-failover DISABLE

    3. 确认系统返回以下消息:已在节点 IAAS_MANAGER_SERVICE_NODEID 上禁用 Manager Service 自动故障切换模式 (Disabling Manager Service automatic failover mode on node: IAAS_MANAGER_SERVICE_NODEID done)

  • 通过检查 Manager Service 配置文件来验证每个 Manager Service 节点上均已禁用故障切换。
    1. 在 Manager Service 节点上打开命令提示符。

    2. 导航到 vRealize Automation 安装文件夹,然后打开位于 VMware\vCAC\Server\ManagerService.exe.config 的 Manager Service 配置文件。

    3. 确认 <appSettings> 部分存在以下元素。

      • <add key="FailoverModeEnabled" value="False" />

  • 要创建冷待机 Manager Service 节点,请将该节点的 Windows VMware vCloud Automation Center 服务状态设置为“已停止”,并将启动类型设置为“手动”。
  • 对于活动 Manager Service 节点,该节点的 Windows VMware vCloud Automation Center 服务状态必须设置为“已启动”且启动类型必须为“自动”。
  • manager-service-automatic-failover 命令使用 Manager Service 节点内部 ID:IAAS_MANAGER_SERVICE_NODEID。要查找与此内部 ID 对应的主机名,请运行 vra-command list-nodes 命令并查找 NodeId 为 IAAS_MANAGER_SERVICE_NODEID 的 Manager Service 主机。
  • 要查找系统自动选作当前活动服务的 Manager Service,请执行以下步骤。
    1. 使用 SSH 以 root 用户身份登录到主 vRealize Automation 设备节点。

    2. 运行 vra-command list-nodes --components

      • 如果已启用故障切换,则查找状态为“活动”的 Manager Service 节点。

      • 如果已禁用故障切换,则查找状态为“已启动”的 Manager Service 节点。