可用性有两层,即使用者层和提供者层。vSphere 可用性仪表板涵盖提供者层。此仪表板包括一个集群,而不是 ESXi 主机,因为集群在操作上属于单个计算提供者。此仪表板考虑了 N+1 设计,其中集群可以承受一个主机故障。从逻辑上讲,主机数量较少的集群的风险更高。

设计注意事项

vSphere 可用性仪表板可帮助您分析和报告正常运行时间,因为可用性通常是正式业务 SLA 的一部分。每月运行摘要报告中通常也需要它。

此仪表板不设计用于实时监控正常运行时间。NOC 型仪表板更适合这些用例。必须利用诸如 vRealize Log Insight 之类的 VMware Tools,因为发生故障之前通常会出现软错误。

如何使用仪表板

  • 集群小组件列出了环境中的所有集群。它按最短正常运行时间排序,因此将显示过去一个月内正常运行时间最短的集群。
    • 正在运行的主机列采用颜色编码,因为在逻辑上,较小集群的风险较高。单主机故障会导致相对较高的容量降级。
    • vSAN?列是超融合的,这意味着将考虑计算和存储部分。
    • 准入控制策略列基于“集群配置\DAS 配置\活动”属性。代码与名称之间的映射为:
      • -1:已禁用
      • 0:集群资源百分比
      • 1:插槽策略(已打开电源的虚拟机)
      • 2:专用故障切换主机
    • 在大型环境中,为集群列表创建筛选器可使其更易于管理。按服务等级(如金级、银级和铜级)进行分组,并将所选内容默认设置为金级。这样,您就可以轻松查看金牌集群。
  • 单击集群小组件中的任意集群。
    • 将在所选集群正常运行时间趋势小组件中自动绘制集群正常运行时间。它分别使用红色、橙色和黄色来表示阈值 99%、99.% 和 99.99%。
    • 将自动更新所选集群中的 ESXi 小组件中的 ESXi 主机详细信息。对于更多上下文,您可以添加一个属性小组件来列出所选 ESXi 主机属性。
    • 所选集群中的 ESXi 小组件中,连接到 vCenter维护状态列不是平均值,因为两者都是字符串。但是,它们会显示所选时间段内的最后一个状态。这样,您可以返回到特定时间点,并查看该时间点的可用性。
  • 数据存储不可用小组件仅列出处于已关闭电源状态的数据存储。这涵盖本地和共享数据存储。要添加上下文,请考虑添加额外的列(如它所在的数据中心)以及 NFS 和 VMFS 等数据存储类型。
  • 端口组可用性小组件列出当前具有低于 100% 的正常运行时间的端口组。要添加上下文,请考虑添加额外的列,如数据中心所在的位置、已使用的端口数和最大端口数。
  • 对于更多上下文,您可以添加一个属性小组件来列出所选对象属性。多个表格可以驱动同一个属性小组件,但对象类型必须相同。
  • 在大型环境中,您可以为此仪表板创建一个筛选器。按服务等级(如金级、银级和铜级)进行分组,并将所选内容默认设置为金级。这样,监控不会因为不太关键的工作负载而混乱。
  • 所选集群中的 ESXi 小组件中,连接到 vCenter维护状态列不是平均值,因为两者都是字符串。但是,它们会显示所选时间段内的最后一个状态。这样,您可以返回到特定时间点,并查看该时间点的可用性。

注意事项

  • 您可以添加 vCenter Server 和 NSX 组件可用性。这需要 VMware SDDC Health Monitoring Solution