您可以使用 Aria Operations for Logs 或 Splunk 來監控 NSX 環境。

您可以在 https://splunkbase.splunk.com/app/4241 找到 NSX Splunk 應用程式。

Aria Operations for Logs 內容套件具有下列警示:

警示名稱 說明
SysCpuUsage CPU 使用率高於 95% 且超過 10 分鐘。
SysMemUsage 記憶體使用量高於 95% 且超過 10 分鐘。
SysDiskUsage 一或多個磁碟分割的磁碟使用量高於 89% 且超過 10 分鐘。
PasswordExpiry 應用裝置使用者帳戶的密碼即將到期或已到期。
CertificateExpiry 一或多個 CA 簽署的憑證已到期。
ClusterNodeStatus 本機 Edge 叢集節點已關閉。
BackupFailure NSX 排程的備份作業失敗。
VipLeadership NSX 管理叢集 VIP 已關閉。
ApiRateLimit 用戶端 API 已達到設定的臨界值。
CorfuQuorumLost 叢集中的兩個節點已關閉,且遺失 corfu 仲裁。
DfwHeapMem DFW 堆積記憶體已超過設定的臨界值。
ProcessStatus 重要處理程序狀態已變更。
ClusterFailoverStatus SR 高可用性狀態已變更或作用中/待命服務容錯移轉。
DhcpPoolUsageOverloadedEvent DHCP 集區已達到設定的使用量臨界值。
FabricCryptoStatus Edge 加密 mux 驅動程式已針對失敗的 Known_Answer_Tests (KAT) 關閉。
VpnTunnelState VPN 通道已關閉。
BfdTunnelStatus BFD 通道狀態已變更。
RoutingBgpNeighborStatus BGP 芳鄰狀態為關閉。
VpnL2SessionStatus L2 VPN 工作階段已關閉。
VpnIkeSessionStatus IKE 工作階段已關閉。
RoutingStatus 路由 (BGP/BFD) 已關閉。
DnsForwarderStatus DNS 轉寄站執行狀態為關閉。
TnConnDown_15min 對控制器/管理程式的傳輸節點連線已關閉,且已持續至少 15 分鐘。
TnConnDown_5min 對控制器/管理程式的傳輸節點連線已關閉,且已持續至少 5 分鐘。
ServiceDown 一或多個服務已關閉。
IpNotAvailableInPool 集區中沒有可用的 IP 或已達到設定的臨界值。
LoadBalancerError NSX 負載平衡器服務狀態為錯誤。
LoadBalancerDown NSX 負載平衡器服務狀態為關閉。
LoadBalancerVsDown VS 狀態:所有集區成員已關閉。
LoadBalancerPoolDown 集區狀態:所有集區成員已關閉。
ProcessCrash 在資料路徑或其他 LB 處理程序 (如發送器等) 中,處理程序或精靈當機。

儀表板

Splunk 應用程式和 Aria Operations for Logs 內容套件都具有下列儀表板。

表 1. NSX - 基礎結構
Widget 名稱 備註
NSX Manager:通訊錯誤 這些是 NSX Manager 上的所有通訊記錄錯誤。這些錯誤依主機名稱進行分組。
傳輸節點 - NSX Manager:通訊錯誤 NSX 傳輸節點 (vSphere 主機、KVM 主機和 NSX Edge) 和 NSX Manager 之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。
傳輸節點 - 控制器:通訊錯誤 NSX 傳輸節點 (vSphere 主機、KVM 主機和 NSX Edge) 和 NSX Controller 之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。
控制器:通訊錯誤 叢集中控制器之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。
組態錯誤 此 Widget 以建立 NSX 基礎結構的各種元件所產生的已知錯誤模式為基礎。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。
其他錯誤 所有 NSX 元件中的其他錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。主機代理程式失敗 (如 netcpa 關閉或 MPA 關閉) 可能需要立即採取行動。
表 2. NSX - 稽核
Widget 名稱 備註
邏輯交換器稽核

從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。

邏輯交換器稽核詳細資料 所有邏輯交換器稽核事件。此 Widget 以建立 NSX 邏輯交換器基礎結構的各種元件所產生的已知錯誤模式為基礎。
邏輯交換器連接埠稽核

從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯交換器連接埠訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器連接埠稽核事件的通用計數。

邏輯交換器連接埠稽核詳細資料 所有邏輯交換器連接埠稽核事件。此 Widget 以建立 NSX 邏輯交換器基礎結構的各種元件所產生的已知錯誤模式為基礎。
邏輯路由器稽核

從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。

邏輯路由器稽核詳細資料 所有邏輯路由器稽核事件。此 Widget 以建立 NSX 邏輯路由基礎結構的各種元件所產生的已知錯誤模式為基礎。
邏輯路由器連接埠稽核

從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯路由器連接埠訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器連接埠稽核事件的通用計數。

邏輯路由器連接埠稽核詳細資料 所有邏輯交換器連接埠稽核事件。此 Widget 以建立 NSX 邏輯路由器基礎結構的各種元件所產生的已知錯誤模式為基礎。
防火牆稽核

從擷取任何使用新規則新增區段、更新區段或刪除區段事件的 NSX 稽核記錄中摘要的防火牆訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆稽核事件的通用計數。

邏輯防火牆稽核詳細資料 所有防火牆稽核事件。此 Widget 以 NSX 防火牆所產生的已知錯誤模式為基礎。
表 3.
NSX - 邏輯交換器 備註
已建立邏輯交換器

從擷取任何建立事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。

邏輯交換器更新

從擷取任何更新事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。

已刪除邏輯交換器

從擷取任何刪除事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。

邏輯交換器稽核詳細資料 所有邏輯交換器稽核事件。
邏輯交換器 - Manager 錯誤 報告給 NSX Manager 的邏輯交換器記錄錯誤。錯誤依主機名稱進行分組。
邏輯交換器 - Controller 錯誤 從 NSX Controller 檢視中報告的邏輯交換器記錄錯誤。錯誤依主機名稱進行分組。
邏輯交換器 - 傳輸節點錯誤 所有 NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 報告的邏輯交換器記錄錯誤。錯誤依節點進行分組。
表 4. NSX - 邏輯路由器
Widget 名稱 備註
邏輯路由器建立稽核事件

從擷取任何建立事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。

邏輯路由器更新稽核事件

從擷取任何更新事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。

邏輯路由器刪除稽核事件

從擷取任何刪除事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。

邏輯路由器稽核詳細資料 所有邏輯路由器稽核事件。
邏輯路由器 - Manager 錯誤 報告給 NSX Manager 的邏輯路由器記錄錯誤。錯誤依主機名稱進行分組。
邏輯路由器 - Controller 錯誤 NSX Controller 偵測的邏輯路由器記錄錯誤。錯誤依主機名稱進行分組。
邏輯路由器 - 傳輸節點錯誤 NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 的邏輯路由器記錄錯誤。錯誤依節點進行分組。
表 5. NSX - 分散式防火牆概觀
Widget 名稱 備註
區段建立事件

所有防火牆區段建立稽核事件。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

區段更新事件

所有防火牆區段更新稽核事件。

附註 - 對規則執行的任何建立、更新和刪除活動都會引發區段更新事件。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

區段刪除事件

所有防火牆區段刪除稽核事件。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

區段稽核詳細資料

顯示所有防火牆稽核事件 (誰變更了什麼)。

附註 - 對規則執行的任何建立、更新和刪除活動都會引發區段更新事件。

防火牆 - Manager 錯誤 報告給 NSX Manager 的防火牆記錄錯誤。錯誤依主機名稱進行分組。
防火牆 - Controller 錯誤 報告給 NSX Controller 的防火牆記錄錯誤。錯誤依主機名稱進行分組。
防火牆 - 傳輸節點錯誤 NSX 傳輸節點 (vSphere 主機和 KVM 主機) 上的防火牆記錄錯誤。錯誤依節點進行分組。
表 6. NSX - 分散式防火牆流量
Widget 名稱 備註
最高排名防火牆來源 所有正在記錄資料的防火牆規則中最高排名的來源 IP 位址。
最高排名防火牆目的地 所有正在記錄資料的防火牆規則中最高排名的目的地 IP 位址。
允許的應用程式連接埠 依目的地連接埠衡量 NSX-T 環境中允許的所有傳入/傳出連線。該資料是指定的時間範圍的總和。
拒絕的應用程式連接埠 防火牆規則拒絕的所有流量。資料依應用程式 (或目的地) 連接埠號碼進行分組。此 Widget 僅顯示與連接埠相關聯的資料。不會顯示不含相關聯連接埠的流量類型,例如 ICMP。
依位元組的最高排名防火牆來源 - 用戶端到伺服器 依來源 IP 位址的從用戶端到伺服器的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名防火牆目的地 - 用戶端到伺服器 依目的地 IP 位址的從用戶端到伺服器的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名防火牆來源 - 伺服器到用戶端 依來源 IP 位址的從伺服器到用戶端的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名防火牆目的地 - 伺服器到用戶端 依目的地 IP 位址的從伺服器到用戶端的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
表 7. NSX - DHCP
Widget 名稱 備註
DHCP 建立稽核事件

所有 DHCP 都會建立稽核事件,包括新的 DHCP 設定檔、靜態繫結或 IP 集區。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

DHCP 更新稽核事件

所有 DHCP 都會更新稽核事件,包括更新的 DHCP 設定檔、靜態繫結和 IP 集區。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

DHCP 刪除稽核事件

所有 DHCP 都會刪除稽核事件,包括刪除的 DHCP 設定檔、靜態繫結或 IP 集區。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

DHCP 稽核詳細資料 所有 DHCP 稽核事件。
DHCP - Manager 錯誤 NSX Manager 報告的 DHCP 記錄錯誤。
DHCP - Controller 錯誤 NSX Controller 報告的 DHCP 記錄錯誤。
DHCP - 傳輸節點錯誤 NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 報告的 DHCP 記錄錯誤。
表 8. NSX - 備份
Widget 名稱 備註
備份組態更新 對備份組態進行更新的總次數。
備份失敗 在一段時間內依錯誤碼進行分組的所有備份失敗的計數。
成功的叢集備份 成功完成的叢集和節點備份總數。
失敗的叢集備份 失敗的叢集和節點備份總數。
成功的詳細目錄備份 成功完成的詳細目錄備份總數。
失敗的詳細目錄備份 失敗的詳細目錄備份總數。
表 9. NSX - IPAM
Widget 名稱 備註
IPAM 建立事件

從擷取任何建立事件的 NSX 稽核記錄中摘要的 IPAM 訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。

IPAM 更新事件

從擷取任何更新事件的 NSX 稽核記錄中摘要的 IPAM 訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。

IPAM 刪除事件

從擷取任何刪除事件的 NSX 稽核記錄中摘要的 IPAM 訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。

IPAM 稽核詳細資料 所有 IPAM 稽核事件。
IPAM - Manager 錯誤 NSX Manager 報告的 IPAM 記錄錯誤。
表 10. NSX - 統一安全性流量記錄
Widget 名稱 備註
最高排名的安全性類別來源 所有正在記錄資料的安全性類別中最高排名的來源 IP 位址。
最高排名的安全性類別目的地 所有正在記錄資料的安全性類別中最高排名的目的地 IP 位址。
允許的應用程式連接埠 依目的地連接埠衡量 NSX-T 環境中允許的所有傳入/傳出連線。該資料是指定的時間範圍的總和。
拒絕的應用程式連接埠 安全性類別規則拒絕的所有安全性流量。資料依應用程式 (或目的地) 連接埠號碼進行分組。此 Widget 僅顯示與連接埠相關聯的資料。不會顯示不含相關聯連接埠的流量類型,例如 ICMP。
依位元組的最高排名安全性類別來源 - 用戶端到伺服器 依來源 IP 位址的從用戶端到伺服器的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名安全性類別目的地 - 用戶端到伺服器 依目的地 IP 位址的從用戶端到伺服器的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名安全性類別來源 - 伺服器到用戶端 依來源 IP 位址的從伺服器到用戶端的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名安全性類別目的地 - 伺服器到用戶端 依目的地 IP 位址的從伺服器到用戶端的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。