vCenter Server 提供了一组默认警报,可监控 vSphere 清单对象的操作。必须仅设置这些警报的操作。

某些警报是无状态的。vCenter Server 不会保留无状态警报上的数据,且既不会计算也不会显示其状态。无法确认或重置无状态警报。无状态警报由其名称旁边的星号表示。

表 1. 默认 vSphere 警报
警报名称 描述
主机连接和启动状况 监控主机的电源状况以及主机是否可以访问。
主机 CPU 使用情况 监控主机 CPU 使用情况。
主机内存使用情况 监控主机内存使用情况。
虚拟机 CPU 使用情况 监控虚拟机 CPU 使用情况。
虚拟机内存使用情况 监控虚拟机内存使用情况。
磁盘上数据存储的使用情况 监控数据存储磁盘使用情况。
注: 此警报控制 vSphere Client 中的数据存储的状态值。如果停用此警报,数据存储状态将显示为“未知”。
虚拟机 CPU 就绪情况 监控虚拟机 CPU 就绪时间。
虚拟机磁盘总延迟时间 监控虚拟机磁盘总延迟时间。
已取消的虚拟机磁盘命令 监控已取消的虚拟机磁盘命令数。
已重置的虚拟机磁盘 监控已重置的虚拟机总线数。
许可证清单监控 监控许可证清单的合规性。
许可证用户阈值监控 监控是否超过用户定义的许可证阈值。
许可证容量监控 监控是否超过许可证容量。
主机许可证版本与 vCenter Server 许可证版本不兼容 监控 vCenter Server 和主机许可证版本的兼容性。
主机闪存容量超出 vSAN 的许可限制 监控主机上闪存盘的容量是否超出 vSAN 许可证的限制。
过期的 vSAN 许可证 监控 vSAN 许可证到期时间和评估期结束时间。
vSAN 主机磁盘出错 监控 vSAN 集群中的主机磁盘是否存在错误的默认警报。
启动辅助虚拟机已超时 * 监控是否启动辅助虚拟机已超时。
无兼容主机可用于放置辅助虚拟机 监控可在其上创建和运行辅助虚拟机的兼容主机的可用性。
虚拟机 Fault Tolerance 状况已更改 监控虚拟机 Fault Tolerance 状况的更改。
虚拟机 Fault Tolerance vLockStep 时间间隔状态已更改 监控容错辅助 vLockStep 时间间隔方面的更改。
主机处理器状态 监控主机处理器。
主机内存状态 监控主机内存使用情况。
主机硬件风扇状态 监控主机风扇。
主机硬件电压 监控主机硬件电压。
主机硬件温度状态 监控主机硬件的温度状态。
主机硬件电源状态 监控主机电源状态。
主机硬件系统主板状态 监控主机系统主板状态。
主机电池状态 监控主机电池状态。
其他主机硬件对象的状态 监控其他主机硬件对象。
主机存储状态 监控主机与存储设备的连接。
主机 IPMI 系统事件日志状态 监控 IPMI 系统事件日志的容量。
主机基线板管理控制器状态 监控底板管理控制器的状态。
主机错误 * 监控主机错误和警告事件。
虚拟机错误 * 监控虚拟机错误和警告事件。
主机连接故障 * 监控主机连接故障。
在启用了 SIOC 的数据存储上检测到非受管工作负载 监控启用了 SIOC 的数据存储的非受管 I/O 工作负载。
已超出精简置备的卷容量阈值 监控支持数据存储的卷是否超出存储阵列上的精简置备阈值。
数据存储容量警报 监控支持数据存储的卷的容量状态更改。
VASA 提供程序已断开连接 监控 VASA 提供程序的连接状态更改。
VASA 提供程序证书过期警报 监控 VASA 提供程序证书是否将要过期。
虚拟机存储合规性警报 监控虚拟磁盘与基于对象的存储是否相符。
数据存储合规性警报 监控数据存储上的虚拟磁盘与基于对象的存储是否相符。
为 VASA 提供程序刷新 CA 证书和 CRL 失败 监控为某些 VASA 提供程序刷新 CA 证书和 CRL 是否失败。
vSphere HA 故障切换资源不足 监控 vSphere High Availability 所需故障切换集群资源是否充足。
vSphere HA 正在进行故障切换 监控 vSphere High Availability 的故障切换进度。
找不到 vSphere HA 主代理 监控 vCenter Server 是否可以连接到 vSphere High Availability 主代理。
vSphere HA 主机状态 监控由 vSphere High Availability 报告的主机运行状况。
vSphere HA 虚拟机故障切换失败 监控使用 vSphere High Availability 的故障切换操作是否已失败。
vSphere HA 虚拟机监控操作 监控 vSphere High Availability 是否已重新启动虚拟机。
vSphere HA 虚拟机监控错误 监控 vSphere High Availability 是否无法重置虚拟机。
vSphere HA 虚拟机组件保护无法关闭虚拟机电源 监控是否 vSphere High Availability 虚拟机组件保护因无法访问数据存储而无法关闭虚拟机电源。
许可证错误 * 监控许可证错误。
已更改运行状况 * 监控服务和扩展运行状况的更改。
虚拟机组件保护重新启动错误 监控 vSphere HA 虚拟机组件保护是否无法重新启动虚拟机。
Storage DRS 建议 监控 Storage DRS 建议。
Storage DRS 在主机上不受支持 监控和警示在主机上不支持 Storage DRS 的情形。
数据存储集群空间不足 监控是否数据存储集群磁盘空间不足。
数据存储存在于多个数据中心中 监控是否数据存储集群中的数据存储在多个数据中心中可见。
vSphere Distributed Switch VLAN 中继状态 监控 vSphere Distributed Switch VLAN 中继状态的更改。
vSphere Distributed Switch MTU 匹配状态 监控 vSphere Distributed Switch MTU 匹配状态的更改。
vSphere Distributed Switch MTU 支持状态 监控 vSphere Distributed Switch MTU 支持状态的更改。
vSphere Distributed Switch 绑定匹配状态 监控 vSphere Distributed Switch 绑定匹配状态的更改。
虚拟机网络适配器预留状态 监控虚拟机网络适配器预留状态的更改。
“虚拟机需要整合”状态 监控“虚拟机需要整合”状态的更改。
主机虚拟闪存资源状态 监控主机的 Flash Read Cache 资源状态。
主机虚拟闪存资源使用情况 监控主机上的 Flash Read Cache 资源使用情况。
vSAN 主机上注册/取消注册 VASA 供应商提供程序失败 用于监控在 vSAN 主机上注册或取消注册 VASA 供应商提供程序是否失败的默认警报。
在主机上注册/取消注册第三方 IO 筛选器存储提供程序失败 监控 vCenter Server 在主机上注册或取消注册第三方 IO 筛选器存储提供程序是否失败的默认警报。
服务控制代理运行状况警报 监控 VMware Service Control Agent 的运行状况。
标识运行状况警报 监控身份管理服务的运行状况。
vSphere Client 健康状况警报 监控 vSphere Client 的运行状况。
ESX Agent Manager 运行状况警报 监控 ESX Agent Manager 的运行状况。
消息总线配置运行状况警报 监控消息总线配置服务的运行状况。
CIS 许可证运行状况警报 监控许可证服务的运行状况。
vCenter Server 运行状况警报 监控 vCenter Server 的运行状况。
数据库运行状况警报 监控数据库运行状况。

当数据库空间达到 80% 时,vCenter Server 显示警告事件。

当数据库空间达到 95% 时,vCenter Server 显示错误事件并关闭。可以清理数据库,或者增加数据库存储容量,然后启动 vCenter Server

该警报仅对 PostgreSQL 和 Microsoft SQL Server 数据库运行状况问题触发,而对 Oracle 数据库不起作用。

数据服务运行状况警报 监控数据服务的运行状况。
RBD 运行状况警报 监控 vSphere Auto Deploy Waiter 的运行状况。
vService Manager 运行状况警报 监控 vService Manager 的运行状况。
性能图表服务运行状况警报 监控性能图表服务的运行状况。
内容库服务运行状况警报 监控 VMware Content Library Service 的运行状况。
VMware vSphere ESXi Dump Collector 运行状况警报 监控 VMware vSphere ESXi Dump Collector 服务的运行状况。
VMware vAPI Endpoint 服务运行状况警报 监控 VMware vAPI Endpoint 服务的运行状况。
VMware vSphere Profile-Driven Storage Service 运行状况警报 监控 VMware vSphere Profile-Driven Storage Service 的运行状况。
VMware vFabric Postgres 服务运行状况警报 监控 VMware vFabric Postgres 服务的运行状况。
ESXi 主机证书更新失败状态 监控是否 ESXi 主机证书更新已失败。
ESXi 主机证书状态 监控 ESXi 主机的证书状态。
ESXi 主机证书验证失败状态 监控是否 ESXi 主机证书验证已失败。
vSphere vCenter 主机证书管理模式 监控 vCenter Server 证书管理模式的更改。
根证书状态 监控根证书是否将要过期。
GPU ECC 未更正内存警报 监控 GPU ECC 未更正内存状态。
GPU ECC 已更正内存警报 监控 GPU ECC 已更正内存状态。
GPU 热条件警报 监控 GPU 热条件状态。
网络连接丢失 监控虚拟交换机上的网络连接。
网络上行链路冗余丢失 监控虚拟交换机上的网络上行链路冗余。
网络上行链路冗余已降级 * 监控虚拟交换机上的网络上行链路冗余降级。
VMKernel 网卡未正确配置 * 监控未正确配置的 VMkernel 网卡。
无法连接到存储 * 监控主机与存储设备的连接。
迁移错误 * 监控虚拟机是否无法进行迁移或重定位,或被孤立。
退出待机错误 监控主机是否无法退出待机模式。
表 2. 已弃用的 vSphere 警报
警报名称 描述
设备管理运行状况警报 监控设备管理服务的运行状况。
VMware 常见日志记录服务运行状况警报 监控 VMware 常见日志记录服务的运行状况。
无法连接到网络 监控虚拟交换机上的网络连接。
IPv6 TSO 不受支持 监控由虚拟机的客户机操作系统发送的 IPv6 TSO 数据包是否已丢弃。
SRM 一致性组冲突 数据存储集群中具有属于不同 SRM 一致性组的数据存储。
虚拟机高可用性错误 监控虚拟机上的 High Availability 错误。
集群高可用性错误 * 监控集群上的 High Availability 错误。
运行状况监控 监控在 vCenter Server 组件的总体运行状况方面的更改。
连接到已启用 SIOC 的数据存储的低于 4.1 的主机 监控运行 ESX/ESXi 4.1 或更早版本的主机是否已连接到已启用 SIOC 的数据存储。
主机服务控制台交换率 监控主机服务控制台内存交换率。
清单运行状况警报 监控 Inventory Service 的运行状况。
传输服务运行状况警报 监控 VMware Transfer Service 的运行状况。
VMware System and Hardware Health Manager 服务运行状况警报 监控 VMware System and Hardware Health Manager 服务运行状况。

查看预配置 vSphere 警报的警报定义

您可以查看所有预配置的 vSphere 警报以及为每个清单对象配置的所有警报的定义。

触发预配置的警报时,如果您希望查看触发该警报的规则,则可以查看警报定义。

过程

  1. 从清单中选择对象,然后单击配置选项卡。
  2. 在左侧导航窗格中,单击警报定义
    此时将显示一个列表,其中包含所选对象的所有已配置警报。
  3. (可选) 使用每列上方的筛选器快速查找警报定义。
  4. 单击警报名称左侧的箭头。

结果

您可以查看与警报配置相关的所有信息,包括警报的描述、目标对象以及触发警报的警报规则。