若要提高 Orchestrator 服务的可用性,请在包含共享数据库的群集中启动多个 Orchestrator 服务器实例。在配置为作为群集的一部分运行前,vRealize Orchestrator 始终作为单个实例运行。

Orchestrator 群集

具有相同服务器配置与插件配置的多个 Orchestrator 服务器实例可在同一个群集中运行,并且共享同一个数据库。

所有 Orchestrator 服务器实例可通过交换检测信号互相通信。每个检测信号都是一个时间戳,节点会按特定间隔将这些时间戳写入到群集的共享数据库中。网络问题、数据库服务器未响应或过载都可能导致 Orchestrator 群集节点停止响应。如果活动的 Orchestrator 服务器实例未能在故障切换超时时间段内发送检测信号,则会被认为未响应。故障切换超时时间等于检测信号间隔值乘以故障切换检测信号数量。可以据此来判定不可靠的节点,并可根据可用的资源和生产负载自定义该值。

Orchestrator 节点在丢失与数据库的连接时会进入待机模式,并将此模式一直保持到数据库连接恢复为止。通过从最后未完成的项目(例如可编辑脚本任务或工作流调用)恢复所有中断的工作流,群集中的其他节点将接管活动的作业。

Orchestrator 不提供内置工具用于监控群集状态和发送故障切换通知。您可以使用外部组件(例如负载平衡器)监控群集状态。要检查一个节点是否正在运行,您可以在 https://your_orchestrator_server_IP_or_DNS_name:8281/vco/api/healthstatus 使用运行状况 REST API 服务,并在 https://your_orchestrator_server_IP_or_DNS_name:8283/vco-controlcenter/docs/ 检查节点的状态以监控控制中心的状态。