VMware Aria Operations for Networks 从收集器、平台和系统收集运行状况衡量指标,以诊断和监控与 VMware Aria Operations for Networks 实例相关的运行状况问题。

运行状况衡量指标有以下类型:

  • 节点衡量指标
  • 服务衡量指标
  • 系统衡量指标

查看运行状况衡量指标

可以在 VMware Aria Operations for Networks 平台和收集器页面上查看节点衡量指标和服务衡量指标。但是,只能在系统仪表板页面上查看系统衡量指标。

要查看节点衡量指标和服务衡量指标,请执行以下操作:

  1. 在搜索栏中输入平台收集器
  2. 在搜索结果页面上,选择一个平台或收集器以查看适用于该实体的运行状况衡量指标。

要查看系统衡量指标,请在搜索栏中输入系统仪表板

节点衡量指标

节点衡量指标提供有关节点的内存、磁盘 IO 和 CPU 利用率的信息。

衡量指标名称 衡量指标 API 名称 描述
内存使用情况 CUSTOM_METRIC[level:node]vRNI.used.memory.percentage.rate.average.number 给定节点中已用内存占已配置内存总量的百分比。
数据磁盘使用情况 CUSTOM_METRIC[level:node]vRNI.used.disk.percentage.rate.average.number 给定节点中已用磁盘输入/输出的百分比。
CPU 使用情况 CUSTOM_METRIC[level:node]vRNI.cpu.utilization.percentage.rate.average.number

给定节点中已用 CPU 占可用 CPU 总量的百分比。

服务衡量指标

服务衡量指标指示服务是否正在运行。在衡量指标 API 名称中,必须将 <service_name> 替换为您的服务名称(如 IpfixProcessor、ElasticSearch、Kafka),才能查看服务的状态。

衡量指标名称 衡量指标 API 名称 描述
服务正常运行时间 CUSTOM_METRIC[service.name:<service_name>]vRNI.service.uptime.rate.average.number

用于检查 VMware Aria Operations for Networks 服务是否正在运行且运行正常的二进制指标。

  • 0 表示服务正在运行且运行正常。
  • 1 表示服务正在运行,但运行不正常。
  • 2 表示服务未运行。

系统衡量指标

系统衡量指标提供有关整个 VMware Aria Operations for Networks 系统的性能和使用情况的信息。

衡量指标名称 衡量指标 API 名称 描述
处理滞后 grid.messageAge.absolute.latest.millisecond

系统数据处理网格的滞后时间。

处理滞后较高可能会导致系统显示失效数据。

网格使用率 grid.busy.absolute.latest.percent

VMware Aria Operations for Networks 处理网格的容量利用率。

如果处理负载增加,利用率百分比会一直很高。这可能会导致出现处理滞后较高的潜在风险。

添加许多数据源、频繁添加和删除虚拟机以及增加流计数是导致处理负载增加的几个原因。

索引器滞后 grid.indexerLag.absolute.latest.millisecond

系统索引器的滞后时间。

索引器滞后较高可能会导致系统显示失效数据。

虚拟机计数 vRNI.internal.tenants.usage.vm.count.absolute.maximum.number 系统中已发现的虚拟机总数。
主机计数

vRNI.internal.tenants.usage.host.count.absolute.maximum.numb

系统中已发现的主机总数。
应用程序计数 vRNI.internal.tenants.usage.application.count.absolute.maximum.number 系统中保存的应用程序总数。
每日流计数 vRNI.internal.tenants.usage.flow.daily.count.absolute.maximum.number 过去 24 小时内的唯一流总数。
每周流计数 vRNI.internal.tenants.usage.flow.weekly.count.absolute.maximum.number 过去 7 天内的唯一流总数。
防火墙规则计数 vRNI.internal.tenants.usage.firewallRule.count.absolute.maximum.number 已发现的防火墙规则总数。