如果主机发生故障而需要重新启动虚拟机,您可使用虚拟机重新启动优先级设置控制这一过程的操作顺序。您也可使用主机隔离响应设置,配置主机与其他主机失去管理网络连接时 vSphere HA 的响应方式。

这些设置适用于主机发生故障或主机隔离时群集内的所有虚拟机。此外,也可以为特定虚拟机配置异常。请参见在 vSphere Web Client 中自定义单个虚拟机

虚拟机重新启动优先级

虚拟机重新启动优先级决定了主机发生故障后在新主机上放置虚拟机的相对顺序。这些虚拟机会重新启动,首先尝试启动优先级最高的虚拟机,然后是那些优先级较低的虚拟机,直到重新启动所有虚拟机或再没有可用群集资源为止。请注意,如果 vSphere HA 无法打开高优先级的虚拟机电源,则会继续尝试打开优先级较低的虚拟机电源。因此,虚拟机重新启动优先级不能用于强制执行多个虚拟机应用程序的重新启动优先级。此外,如果主机故障数目超过了接入控制所允许的数目,则可能会等到有更多可用资源时再重新启动优先级较低的虚拟机。虚拟机将在故障切换主机(如果已指定)上重新启动。

此设置的值为:已禁用、低、中等(默认)和高。如果选择“已禁用”,则会为虚拟机禁用 vSphere HA,这意味着当其主机出现故障时不会在其他 ESXi 主机上重新启动虚拟机。vSphere HA 的虚拟机/应用程序监控功能会忽略“已禁用”设置,因为该功能可保护虚拟机免受操作系统级别故障而不是虚拟机故障。当出现操作系统级别故障时,vSphere HA 将重新引导操作系统,而虚拟机则在同一台主机上继续运行。您可更改各个虚拟机的这种设置。

注:

虚拟机重置会导致客户机操作系统硬重新引导,但是不会重新启动虚拟机。

虚拟机的重新启动优先级设置因用户需求而有所不同。请为提供最重要服务的虚拟机分配较高的重新启动优先级。

例如,在多层应用程序中,可以根据虚拟机上所驻留的功能来对分配进行排序。

  • 高。将为应用程序提供数据的数据库服务器。

  • 中等。使用数据库中的数据并在网页上提供结果的应用程序服务器。

  • 低。接收用户请求、将查询传递到应用程序服务器并将结果返回给用户的 Web 服务器。

主机隔离响应

主机隔离响应确定当 vSphere HA 群集内的某个主机失去其管理网络连接但仍继续运行时出现的情况。您可使用隔离响应使 vSphere HA 关闭独立主机上运行的虚拟机电源,然后在非独立主机上将其重新启动。主机隔离响应要求启用“主机监控状态”。如果“主机监控状态”处于禁用状态,则主机隔离响应将同样被挂起。当主机无法与其他主机上运行的代理通信且无法 ping 其隔离地址时,该主机确定其已被隔离。发生这种情况时,主机会执行其隔离响应。响应包括:保持打开电源(默认值)、关闭电源然后进行故障切换、关机然后进行故障切换。还可以为各个虚拟机自定义此属性。

注:

如果虚拟机的重新启动优先级设置为“已禁用”,则不会做出任何主机隔离响应。

要使用“关机”设置,必须在虚拟机的客户机操作系统中安装 VMware Tools。将虚拟机关机的优点在于可以保留其状况。关机操作优于关闭虚拟机电源操作,关闭虚拟机不会将最近的更改刷新到磁盘中,也不会提交事务。在关机完成时,正在关机的虚拟机需要更长时间进行故障切换。未在 300 秒内或在高级属性 das.isolationshutdowntimeout 中指定的秒数内关机的虚拟机将被关闭电源。

注:

创建 vSphere HA 群集后,可以替代特定虚拟机的“重新启动优先级”和“隔离响应”的默认群集设置。此替代操作对于用于特殊任务的虚拟机很有帮助。例如,可能需要先打开提供基础架构服务(如 DNS 或 DHCP)的虚拟机电源,再打开群集内的其他虚拟机电源。

如果主机禁用其隔离响应(即隔离时使虚拟机处于打开电源状态)且无法访问管理和存储网络,则可能发生“裂脑”情况。在这种情况下,即使虚拟机的原始实例仍在独立主机上运行,独立主机也会丢失磁盘锁且虚拟机会故障切换至另一主机。主机能够重新访问虚拟机的数据存储时,将会有两个虚拟机副本,但原来独立主机上的副本无权访问 vmdk 文件,这样便避免了数据损坏。

为了从此情况中恢复,ESXi 会针对已丢失硬盘锁的虚拟机生成一个问题(关于主机何时摆脱隔离状态并认识到无法重新获取磁盘锁)。vSphere HA 将自动回答该问题,这就使已丢失磁盘锁的虚拟机实例关闭电源,只留下具有磁盘锁的实例。