vCenter 介面卡會提供在您環境中主機系統物件上產生警示的警示定義。

以健全狀況/症狀為基礎

這些警示定義有下列的影響與嚴重度資訊。

影響

健全狀況

嚴重度

以症狀為基礎

警示定義

症狀

建議

主機存在 CPU 爭用問題,由少於半數的虛擬機器所致。

症狀全部列舉如下:

  • ! 叢集內的主機

  • 主機 CPU 爭用處於警告/急迫/嚴重層級

  • > 0 的子系虛擬機器有 [虛擬機器 CPU 需求處於警告/急迫/嚴重層級]

  • <= 50% 的子系虛擬機器有 [虛擬機器 CPU 需求處於警告/急迫/嚴重層級]

使用 vSphere vMotion 將高 CPU 工作負載的一些虛擬機器移轉至其他具有可用 CPU 容量的主機。

主機存在 CPU 爭用問題,由多於半數的虛擬機器所致。

症狀全部列舉如下:

  • ! 叢集內的主機

  • 主機 CPU 爭用處於警告/急迫/嚴重層級

  • 主機 CPU 需求處於警告/急迫/嚴重層級

  • > 50% 的子系虛擬機器有 [虛擬機器 CPU 需求處於警告/急迫/嚴重層級]

  1. 使用 vSphere vMotion 將高 CPU 工作負載的一些虛擬機器移轉至其他具有可用 CPU 容量的主機。

  2. 升級主機或使用具有更多 CPU 容量的主機。

主機因虛擬機器過剩而存在 CPU 爭用問題。

症狀全部列舉如下:

  • ! 叢集內的主機

  • 主機 CPU 爭用處於警告/急迫/嚴重層級

  • 主機 CPU 需求處於警告/急迫/嚴重層級

  • 零部子系虛擬機器有 [虛擬機器 CPU 需求處於警告/急迫/嚴重層級]

  1. 使用 vSphere vMotion 將高 CPU 工作負載的一些虛擬機器移轉至其他具有可用 CPU 容量的主機。

  2. 升級主機或使用具有更多 CPU 容量的主機。

非 DRS 叢集中的主機存在 CPU 爭用問題,由少於半數的虛擬機器所致。

症狀全部列舉如下:

  • 叢集內的主機

  • [ ! DRS 已啟用,或者 ! DRS 已全自動化]

  • 主機 CPU 爭用處於警告/急迫/嚴重層級

  • > 0 的子系虛擬機器有 [虛擬機器 CPU 需求處於警告/急迫/嚴重層級]

  • <= 50% 的子系虛擬機器有 [虛擬機器 CPU 需求處於警告/急迫/嚴重層級]

使用 vSphere vMotion 將高 CPU 工作負載的一些虛擬機器移轉至其他具有可用 CPU 容量的主機。

非 DRS 叢集中的主機存在 CPU 爭用問題,由多於半數的虛擬機器所致。

症狀全部列舉如下:

  • 叢集內的主機

  • [ ! DRS 已啟用,或者 ! DRS 已全自動化]

  • 主機 CPU 爭用處於警告/急迫/嚴重層級

  • 主機 CPU 需求處於警告/急迫/嚴重層級

  • > 50% 的子系虛擬機器有 [虛擬機器 CPU 需求處於警告/急迫/嚴重層級]

  1. 使用 vSphere vMotion 將高 CPU 工作負載的一些虛擬機器移轉至其他具有可用 CPU 容量的主機。

  2. 升級主機或使用具有更多 CPU 容量的主機。

非 DRS 叢集中的主機因虛擬機器過剩而存在 CPU 爭用問題。

症狀全部列舉如下:

  • 叢集內的主機

  • [ ! DRS 已啟用,或者 !DRS 已全自動化]

  • 主機 CPU 爭用處於警告/急迫/嚴重層級

  • 主機 CPU 需求處於警告/急迫/嚴重層級

  • 零部子系虛擬機器有 [虛擬機器 CPU 需求處於警告/急迫/嚴重層級]

  1. 使用 vSphere vMotion 將高 CPU 工作負載的一些虛擬機器移轉至其他具有可用 CPU 容量的主機。

  2. 升級主機或使用具有更多 CPU 容量的主機。

主機存在記憶體爭用問題,由少於半數的虛擬機器所致。

症狀全部列舉如下:

  • ! 叢集內的主機

  • 主機記憶體爭用處於警告/急迫/嚴重層級

  • > 0 的子系虛擬機器有 [虛擬機器記憶體工作負載處於警告/急迫/嚴重層級]

  • <= 50% 的子系虛擬機器有 [虛擬機器記憶體工作負載處於警告/急迫/嚴重層級]

使用 vSphere vMotion 將高記憶體工作負載的一些虛擬機器移轉到其他具有可用記憶體容量的主機。

主機存在記憶體爭用問題,由多於半數的虛擬機器所致。

症狀全部列舉如下:

  • ! 叢集內的主機

  • 主機記憶體工作負載處於警告/急迫/嚴重層級

  • 主機記憶體爭用處於警告/急迫/嚴重層級

  • > 50% 的子系虛擬機器有 [虛擬機器記憶體工作負載處於警告/急迫/嚴重層級]

  1. 使用 vSphere vMotion 將高記憶體工作負載的一些虛擬機器移轉到其他具有可用記憶體容量的主機。

  2. 升級主機以使用具有更多記憶體容量的主機。

主機因虛擬機器過剩而存在記憶體爭用問題。

症狀全部列舉如下:

  • ! 叢集內的主機

  • 主機記憶體工作負載處於警告/急迫/嚴重層級

  • 主機記憶體爭用處於警告/急迫/嚴重層級

  • 零部子系虛擬機器有 [虛擬機器記憶體工作負載處於警告/急迫/嚴重層級]

  1. 使用 vSphere vMotion 將高記憶體工作負載的一些虛擬機器移轉到其他具有可用記憶體容量的主機。

  2. 升級主機或使用具有更多記憶體容量的主機。

非 DRS 叢集中的主機存在記憶體爭用問題,由少於半數的虛擬機器所致。

症狀全部列舉如下:

  • 叢集內的主機

  • [ ! DRS 已啟用,或者 !DRS 已全自動化]

  • 主機記憶體爭用處於警告/急迫/嚴重層級

  • > 0 的子系虛擬機器有 [虛擬機器記憶體工作負載處於警告/急迫/嚴重層級]

  • <= 50% 的子系虛擬機器有 [虛擬機器記憶體工作負載處於警告/急迫/嚴重層級]

使用 vSphere vMotion 將高記憶體工作負載的一些虛擬機器移轉到其他具有可用記憶體容量的主機。

非 DRS 叢集中的主機存在記憶體爭用問題,由多於半數的虛擬機器所致。

症狀全部列舉如下:

  • 叢集內的主機

  • [ ! DRS 已啟用,或者 !DRS 已全自動化]

  • 主機記憶體工作負載處於警告/急迫/嚴重層級

  • 主機記憶體爭用處於警告/急迫/嚴重層級

  • > 50% 的子系虛擬機器有 [虛擬機器記憶體工作負載處於警告/急迫/嚴重層級]

  1. 使用 vSphere vMotion 將高記憶體工作負載的一些虛擬機器移轉到其他具有可用記憶體容量的主機。

  2. 升級主機或使用具有更多記憶體容量的主機。

非 DRS 叢集中的主機因虛擬機器過剩而存在記憶體爭用問題。

症狀全部列舉如下:

  • 叢集內的主機

  • [ ! DRS 已啟用,或者 !DRS 已全自動化]

  • 主機記憶體工作負載處於警告/急迫/嚴重層級

  • 主機記憶體爭用處於警告/急迫/嚴重層級

  • 零部子系虛擬機器有 [虛擬機器記憶體工作負載處於警告/急迫/嚴重層級]

  1. 使用 vSphere vMotion 將高記憶體工作負載的一些虛擬機器移轉到其他具有可用記憶體容量的主機。

  2. 升級主機或使用具有更多記憶體容量的主機。

主機正面臨接收的捨棄封包數過高問題。

症狀全部列舉如下:

  • 主機網路接收了捨棄的封包

  • 主機網路接收的捨棄封包數高於 DT

  • 主機網路資料接收的工作負載處於警告層級

  • 主機網路資料接收的工作負載高於 DT

  • 主機 CPU 需求處於嚴重層級

  1. 如果主機有一個 CPU,請升級主機或使用具有更多 CPU 容量的主機。

  2. 新增額外 NIC 至主機。

  3. 將部分虛擬機器移到具有較低網路流量的主機,藉此減少虛擬機器產生的網路流量。

主機正面臨傳輸的捨棄封包數過高問題。

症狀全部列舉如下:

  • 主機網路傳輸了捨棄的封包

  • 主機網路傳輸的捨棄封包數高於 DT

  • 主機網路資料傳輸的工作負載處於警告層級

  • 主機網路資料傳輸的工作負載高於 DT

  • 主機正在捨棄的封包數百分比過高

  1. 新增額外 NIC 至主機。

  2. 將部分虛擬機器移到具有較低網路流量的主機,藉此減少虛擬機器產生的網路流量。

ESXi 主機在實體 NIC 上偵測到「Flapping」(振盪不穩) 連結狀態。

實體 NIC 連結狀態 Flapping (振盪不穩) (錯誤症狀)。

ESXi 停用該裝置,以避免連結 Flapping (振盪不穩) 狀態。您可能需要更換實體 NIC。在 NIC 修復並正常運作後,警示就會取消。如果更換實體 NIC,您可能需要手動取消警示。

ESXi 主機偵測到實體 NIC 上的連結狀態關閉。

實體 NIC 連結狀態關閉 (錯誤症狀)。

ESXi 停用該裝置,以避免連結 Flapping (振盪不穩) 狀態。您可能需要更換實體 NIC。在 NIC 修復並正常運作後,警示就會取消。如果更換實體 NIC,您可能需要手動取消警示。

電池感應器回報發生問題。

  • 電池感應器健全狀況為紅色,或者

  • 電池感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

BMC 感應器回報發生問題。

  • BMC 感應器健全狀況為紅色,或者

  • BMC 感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

風扇感應器回報發生問題。

  • 風扇感應器健全狀況為紅色,或者

  • 風扇感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

硬體感應器回報發生問題。

  • 硬體感應器健全狀況為紅色,或者

  • 硬體感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

記憶體感應器回報發生問題。

  • 記憶體感應器健全狀況為紅色,或者

  • 記憶體感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

電源感應器回報發生問題。

  • 電源感應器健全狀況為紅色,或者

  • 電源感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

處理器感應器回報發生問題。

  • 處理器感應器健全狀況為紅色

  • 處理器感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

SEL 感應器回報發生問題。

  • SEL 感應器健全狀況為紅色,或者

  • SEL 感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

儲存區感應器回報發生問題。

  • 儲存區感應器健全狀況為紅色,或者

  • 儲存區感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

系統主機板感應器回報發生問題。

  • 系統主機板感應器健全狀況為紅色,或者

  • 系統主機板感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

溫度感應器回報發生問題。

  • 溫度感應器健全狀況為紅色,或者

  • 溫度感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

電壓感應器回報發生問題。

  • 電壓感應器健全狀況為紅色,或者

  • 電壓感應器健全狀況為黃色

如有需要,請變更或更換硬體。請連絡硬體廠商以取得協助。待問題解決後,而且回報問題的感應器指示問題不再存在時,警示就會取消。

健全狀況/嚴重

這些警示定義有下列的影響與嚴重度資訊。

影響

健全狀況

嚴重度

嚴重

警示定義

症狀

建議

主機與 vCenter 之間的連線已中斷。

  • 主機連線已中斷 (錯誤症狀),或者

  • 主機已與 vCenter 中斷連線

登入 vSphere ClientvSphere Web Client,將主機手動重新連線至 vCenter Server 伺服器。主機與 vCenter Server 恢復連線後,警示就會取消。

vSphere High Availability (HA) 偵測到網路隔離的主機。

vSphere HA 偵測到網路隔離的主機 (錯誤症狀)。

該主機無法對其隔離位址執行 Ping 操作且無法與其他主機通訊,請解決此網路問題。請確定 vSphere HA 使用的管理網路包含備援。如有備援,vSphere HA 便可透過多條路徑進行通訊,進而降低主機遭隔離的機率。

vSphere High Availability (HA) 偵測到可能的主機故障問題。

vSphere HA 偵測到主機故障問題 (錯誤症狀)。

尋找 IP 位址重複的電腦,並將其重新設定為採用不同的 IP 位址。基礎問題解決後,系統就會清除此錯誤並取消警示,然後 vSphere HA 主要代理程式就能夠連線至主機上的 HA 代理程式。

備註︰

您可以在 ESX 主機上的 /var/log/vmkernel 記錄檔或 ESXi 主機上的 /var/log/messages 記錄檔中使用 [重複的 IP] 警告,以識別 IP 位址重複的電腦。

由於流量過大,主機正面臨網路爭用問題。

症狀全部列舉如下:

  • 主機正面臨捨棄網路封包問題。

  • 主機網路工作負載處於警告/急迫/嚴重層級

  1. 檢閱連接埠群組與 vSwitch 中的負載平衡原則。

  2. 新增額外 NIC 至主機。

  3. 將部分虛擬機器移到具有較低網路流量的主機,藉此減少虛擬機器產生的網路流量。

主機與 dvPort 的連線已中斷。

與 dvPort 的網路連線中斷 (錯誤症狀)。

更換實體介面卡或重設實體交換器。dvPort 連線恢復時,警示就會取消。

主機與實體網路之間的連線已中斷。

網路連線中斷 (錯誤症狀)。

若要判定實際故障或消除可能的問題,請在 vSphere Client 中或從 ESX 服務主控台檢查 vmnic 的狀態:

  • 若要在 vSphere Client 中檢查狀態,請選取 ESX 主機,然後依序按一下組態網路。目前指派給虛擬交換器的 vmnic 會出現在圖表中。如果 vmnic 顯示紅色 X,表示該連結目前已關閉。

  • 從服務主控台中,執行此命令:esxcfg-nics。顯示的輸出類似下列範例:Name PCI Driver Link Speed Duplex Description ------------------------------------------------------------------ vmnic0 04:04.00 tg3 Up 1000Mbps Full Broadcom BCM5780 Gigabit Ethernet vmnic1 04:04.01 tg3 Up 1000Mbps Full Broadcom BCM5780 Gigabit Ethernet。[連結] 資料行會顯示網路介面卡與實體交換器之間的連結狀態。狀態可能是 [開啟] 或 [關閉]。如果一部分網路介面卡為 [開啟],而另一部分為 [關閉],您可能需要驗證介面卡是否連線至預期的實體交換器連接埠。若要驗證連線,請關閉實體交換器上的每個 ESX 主機連接埠,執行 esxcfg-nics -l",然後觀察受影響的 vmnic。

驗證警示中識別的 vmnic 是否仍然連線至交換器且已正確設定。

  • 確定網路纜線仍然連線至交換器和主機。

  • 確認交換器仍連接系統、正確運作且設定無誤。如需詳細資訊,請參閱交換器說明文件。

  • 檢查實體交換器與 vmnic 之間的活動。您可以執行網路追蹤或觀察活動 LED 燈號,藉以檢查活動。

  • 檢查實體交換器上的網路連接埠設定。

若要在受影響的 vmnic 與服務主控台相關聯的情況下重新設定服務主控台 IP 位址,請參閱 http://kb.vmware.com/kb/1000258。如果問題是由硬體造成,請連絡您的硬體廠商更換硬體。

主機與網路檔案系統 (NFS) 伺服器之間的連線中斷。

與 NFS 伺服器的連線中斷 (錯誤症狀)。

  1. 確認 NFS 伺服器正在執行。

  2. 檢查網路連線,以確定 ESX 主機可連線至 NFS 伺服器。

  3. 判定其他使用相同 NFS 掛接的主機是否遇到相同的問題,並檢查 NFS 伺服器狀態與共用點。

  4. 確定您可以透過登入服務主控台並使用 vmkping 對 NFS 伺服器執行 Ping 的動作來連線至 NFS 伺服器:「vmkping <nfs server>」。

  5. 如需進階疑難排解的相關資訊,請參閱 http://kb.vmware.com/kb/1003967

系統重新開機期間,PCIe 匯流排上發生嚴重錯誤。

發生嚴重的 PCIe 錯誤。

檢查並更換在警示中識別為問題起因的 PCIe 裝置。請連絡廠商以取得協助。

系統開機時偵測到嚴重記憶體錯誤。

發生嚴重的記憶體錯誤。

更換故障記憶體,或連絡廠商。

健全狀況/急迫

這些警示定義有下列的影響與嚴重度資訊。

影響

健全狀況

嚴重度

急迫

警示定義

症狀

建議

主機與 dvPort 之間的冗餘連線已中斷。

遺失對 DVPort 的網路備援 (錯誤症狀)。

更換實體介面卡或重設實體交換器。DVPort 連線恢復時,警示就會取消。

主機已遺失網路的冗餘上行。

遺失網路備援 (錯誤症狀)。

若要判定實際故障或消除可能的問題,請先透過 SSH 或主控台連線至 ESX:

  1. 執行 esxcfg-nics -l 來找出可用的上行連結。

  2. 執行 esxcfg-vswitch -U &lt;affected vmnic#&gt (受影響的 vSwitch),從連接埠群組移除回報的 vmnic。

  3. 執行 esxcfg-vswitch -L &lt;available vmnic#&gt; (受影響的 vSwitch),將可用的上行連結連至受影響的連接埠群組。

接下來,在 vSphere Client 或 ESX 服務主控台中檢查 vmnic 的狀態:

  1. vSphere Client 中,選取 ESX 主機,然後依序按一下組態網路

    目前指派給虛擬交換器的 vmnic 會出現在圖表中。如果 vmnic 顯示紅色 X,表示該連結目前無法使用。

  2. 從服務主控台,執行 esxcfg-nics -l。顯示的輸出類似下列範例:Name PCI Driver Link Speed Duplex Description.

------------------------------------------------------------------ vmnic0 04:04.00 tg3 Up 1000Mbps Full Broadcom BCM5780 Gigabit Ethernet vmnic1 04:04.01 tg3 Up 1000Mbps Full Broadcom BCM5780 Gigabit Ethernet。[連結] 資料行會顯示網路介面卡與實體交換器之間的連結狀態。狀態可能是 [開啟] 或 [關閉]。如果一部分網路介面卡為 [開啟],而另一部分為 [關閉],您可能需要驗證介面卡是否連線至預期的實體交換器連接埠。若要驗證連線,請關閉實體交換器上的每個 ESX 主機連接埠,執行「esxcfg-nics -l」命令,然後觀察受影響的 vmnic。驗證警示中識別的 vmnic 是否仍然連線至交換器且已正確設定。

  1. 確定網路纜線仍然連線至交換器和主機。

  2. 確認交換器仍連接系統、正確運作且設定無誤(請參閱交換器說明文件)。

  3. 執行網路追蹤或觀察活動 LED 燈號,藉以檢查實體交換器與 vmnic 之間的活動。

  4. 檢查實體交換器上的網路連接埠設定。

    若問題出自硬體,請連絡硬體廠商進行硬體更換。

系統開機期間發生 PCIe 錯誤,但此錯誤可復原。

發生可復原的 PCIe 錯誤。

PCIe 錯誤可復原,但是系統行為會視 OEM 廠商韌體處理錯誤的方式而定。請連絡廠商以取得協助。

主機發生可復原的記憶體錯誤。

發生可復原的記憶體錯誤。

由於可復原的記憶體錯誤因廠商而異,請連絡廠商以取得協助。

以風險/症狀為基礎

這些警示定義有下列的影響與嚴重度資訊。

影響

風險

嚴重度

以症狀為基礎

警示定義

症狀

建議

ESXi 主機違反《vSphere 5.5 強化指南》。

  • Active Directory 驗證已停用,或者

  • NTP 服務啟動原則不符合標準,或者

  • SSH 服務正在執行,或者

  • NTP 服務已停止,或者

  • 用於自動停用本機和遠端殼層存取權的逾時值不符合標準,或者

  • 將 ESXi 主機新增到 Active Directory 時,vSphere Authentication Proxy 未用於密碼保護,或者

  • 持續性記錄已停用,或者

  • 用於 iSCSI 流量的雙向 CHAP 已停用,或者

  • 用於限制 NTP 用戶端存取權的防火牆設定不符合標準,或者

  • 用於時間同步化的 NTP 伺服器未設定,或者

  • ESXi Shell 服務啟動原則不符合標準,或者

  • 用於限制 SNMP 伺服器存取權的防火牆設定不符合標準,或者

  • ESXi Shell 服務正在執行,或者

  • DCUI 服務啟動原則不符合標準,或者

  • DvFilter 繫結 IP 位址已設定,或者

  • SSH 服務啟動原則不符合標準,或者

  • DCUI 服務正在執行,或者

  • 互動式殼層自動登出之前的閒置時間不符合標準,或者

  • DCUI 存取使用者清單不符合標準,或者

  • 未啟用遠端 Syslog

根據 vSphere5 強化指南中的建議,修正 vSphere 5.5 強化指南違規問題。