要对 vSphere 实施进行故障排除,请确定问题的症状、确定受影响的组件并测试可行的解决方案。

确定症状
多种潜在原因可能会导致您的实施性能不佳或没有性能。有效故障排除的第一步为准确确定出现了何种错误。
定义问题范围
隔离问题的症状后,必须定义问题范围。确定受影响且可能会导致出现问题的软件或硬件组件以及未受影响的组件。
测试可能的解决方案
了解问题的症状以及受影响的组件后,请系统性测试解决方案,直至问题得以解决。

确定症状

在尝试解决实施中的问题之前,必须准确地确定其故障原因。

故障排除流程中的第一步即收集信息以定义所发生情况的特定症状。收集信息时,您可能会询问以下问题:

  • 什么任务或预期行为未发生?
  • 能否将受影响的任务分为可单独评估的子任务?
  • 任务是否因出错而结束?是否有关联的错误消息?
  • 任务是否已完成但耗时过长?
  • 故障是持续出现还是不定时出现?
  • 最近对软件或硬件做出了哪些可能引起该故障的更改?

定义问题空间

确定问题症状之后,还需确定安装中受影响的组件、可能引起该问题发生的组件,以及未涉及的组件。

要定义 vSphere 实施中的问题空间,请了解现有组件。除 VMware 软件之外,请考虑正在使用的第三方软件以及与 VMware 虚拟硬件结合使用的硬件。

识别软件和硬件元素的特性及其如何影响问题,您可以浏览可能引起这些症状的一般问题。

  • 软件设置的配置错误
  • 物理硬件的故障
  • 组件不兼容

分解流程并单独考虑每个部分及其成为诱因的可能性。例如,与本地存储上虚拟磁盘相关的实例可能与第三方路由器配置毫不关联。但本地磁盘控制器设置可能会导致该问题。如果某个组件与特定症状不相关,则可将其从测试解决方案中排除。

请思考问题出现之前配置最新发生的变化。寻找问题中的共性。如果同时出现多个问题,则可跟踪所有问题以找出相同原因。

测试可能的解决方案

了解问题症状以及最有可能涉及的软件或硬件组件之后,可以系统地测试解决方案,直至解决问题。

使用您所获取的有关症状和受影响组件的信息,可以设计精确定位和解决问题的测试。这些提示可能使此进程更加有效。

  • 尽可能多地想出可能的解决方案。
  • 验证每种解决方案是否可以明确地确定问题解决与否。测试每种可能的解决方案,如果无法解决问题,请立刻继续下一方案。
  • 开发并追求基于可能性逐层递进的潜在解决方案。由最有可能到最没有可能的潜在问题有系统地进行排除,直至症状消失。
  • 测试可能解决方案时,每次仅更改一处。如果在一次性进行多处更改之后您的设置有效,则您可能无法辨别是哪一处更改奏效。
  • 如果为解决方案做出的更改未能帮助解决问题,请将实施返回至上一状态。如果未将实施返回至上一状态,则可能会引发新的错误。
  • 找到一个相似并有效的实施,然后与无法正常工作的实施并行测试。在两个系统上同时进行更改,直至两者之间仅存在少数差异或一处差异。