您可以使用 Log Insight 或 Splunk 監控 NSX-T Data Center 環境。

您可以在 https://splunkbase.splunk.com/app/4241 找到 NSX-T Data Center Splunk 應用程式。

Log Insight 內容套件具有下列警示:

警示名稱 說明
SysCpuUsage CPU 使用率高於 95% 且超過 10 分鐘。
SysMemUsage 記憶體使用量高於 95% 且超過 10 分鐘。
SysDiskUsage 一或多個磁碟分割的磁碟使用量高於 89% 且超過 10 分鐘。
PasswordExpiry 應用裝置使用者帳戶的密碼即將到期或已到期。
CertificateExpiry 一或多個 CA 簽署的憑證已到期。
ClusterNodeStatus 本機 Edge 叢集節點已關閉。
BackupFailure NSX-T Data Center 排程的備份作業失敗。
VipLeadership NSX-T Data Center 管理叢集 VIP 已關閉。
ApiRateLimit 用戶端 API 已達到設定的臨界值。
CorfuQuorumLost 叢集中的兩個節點已關閉,且遺失 corfu 仲裁。
DfwHeapMem DFW 堆積記憶體已超過設定的臨界值。
ProcessStatus 重要處理程序狀態已變更。
ClusterFailoverStatus SR 高可用性狀態已變更或作用中/待命服務容錯移轉。
DhcpPoolUsageOverloadedEvent DHCP 集區已達到設定的使用量臨界值。
FabricCryptoStatus Edge 加密 mux 驅動程式已針對失敗的 Known_Answer_Tests (KAT) 關閉。
VpnTunnelState VPN 通道已關閉。
BfdTunnelStatus BFD 通道狀態已變更。
RoutingBgpNeighborStatus BGP 芳鄰狀態為關閉。
VpnL2SessionStatus L2 VPN 工作階段已關閉。
VpnIkeSessionStatus IKE 工作階段已關閉。
RoutingStatus 路由 (BGP/BFD) 已關閉。
DnsForwarderStatus DNS 轉寄站執行狀態為關閉。
TnConnDown_15min 對控制器/管理程式的傳輸節點連線已關閉,且已持續至少 15 分鐘。
TnConnDown_5min 對控制器/管理程式的傳輸節點連線已關閉,且已持續至少 5 分鐘。
ServiceDown 一或多個服務已關閉。
IpNotAvailableInPool 集區中沒有可用的 IP 或已達到設定的臨界值。
LoadBalancerError NSX-T Data Center 負載平衡器服務狀態為錯誤。
LoadBalancerDown NSX-T Data Center 負載平衡器服務狀態為關閉。
LoadBalancerVsDown VS 狀態:所有集區成員已關閉。
LoadBalancerPoolDown 集區狀態:所有集區成員已關閉。
ProcessCrash 在資料路徑或其他 LB 處理程序 (如發送器等) 中,處理程序或精靈當機。

儀表板

Splunk 應用程式和 Log Insight 內容套件都具有下列儀表板。

表 1. NSX - 基礎結構
Widget 名稱 備註
NSX Manager:通訊錯誤 這些是 NSX Manager 上的所有通訊記錄錯誤。這些錯誤依主機名稱進行分組。
傳輸節點 - NSX Manager:通訊錯誤 NSX 傳輸節點 (vSphere 主機、KVM 主機和 NSX Edge) 和 NSX Manager 之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。
傳輸節點 - 控制器:通訊錯誤 NSX 傳輸節點 (vSphere 主機、KVM 主機和 NSX Edge) 和 NSX Controller 之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。
控制器:通訊錯誤 叢集中控制器之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。
組態錯誤 此 Widget 以建立 NSX 基礎結構的各種元件所產生的已知錯誤模式為基礎。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。
其他錯誤 所有 NSX 元件中的其他錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。主機代理程式失敗 (如 netcpa 關閉或 MPA 關閉) 可能需要立即採取行動。
表 2. NSX - 稽核
Widget 名稱 備註
邏輯交換器稽核

從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。

邏輯交換器稽核詳細資料 所有邏輯交換器稽核事件。此 Widget 以建立 NSX 邏輯交換器基礎結構的各種元件所產生的已知錯誤模式為基礎。
邏輯交換器連接埠稽核

從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯交換器連接埠訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器連接埠稽核事件的通用計數。

邏輯交換器連接埠稽核詳細資料 所有邏輯交換器連接埠稽核事件。此 Widget 以建立 NSX 邏輯交換器基礎結構的各種元件所產生的已知錯誤模式為基礎。
邏輯路由器稽核

從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。

邏輯路由器稽核詳細資料 所有邏輯路由器稽核事件。此 Widget 以建立 NSX 邏輯路由基礎結構的各種元件所產生的已知錯誤模式為基礎。
邏輯路由器連接埠稽核

從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯路由器連接埠訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器連接埠稽核事件的通用計數。

邏輯路由器連接埠稽核詳細資料 所有邏輯交換器連接埠稽核事件。此 Widget 以建立 NSX 邏輯路由器基礎結構的各種元件所產生的已知錯誤模式為基礎。
防火牆稽核

從擷取任何使用新規則新增區段、更新區段或刪除區段事件的 NSX 稽核記錄中摘要的防火牆訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆稽核事件的通用計數。

邏輯防火牆稽核詳細資料 所有防火牆稽核事件。此 Widget 以 NSX 防火牆所產生的已知錯誤模式為基礎。
表 3.
NSX - 邏輯交換器 備註
已建立邏輯交換器

從擷取任何建立事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。

邏輯交換器更新

從擷取任何更新事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。

已刪除邏輯交換器

從擷取任何刪除事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。

邏輯交換器稽核詳細資料 所有邏輯交換器稽核事件。
邏輯交換器 - Manager 錯誤 報告給 NSX Manager 的邏輯交換器記錄錯誤。錯誤依主機名稱進行分組。
邏輯交換器 - Controller 錯誤 從 NSX Controller 檢視中報告的邏輯交換器記錄錯誤。錯誤依主機名稱進行分組。
邏輯交換器 - 傳輸節點錯誤 所有 NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 報告的邏輯交換器記錄錯誤。錯誤依節點進行分組。
表 4. NSX - 邏輯路由器
Widget 名稱 備註
邏輯路由器建立稽核事件

從擷取任何建立事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。

邏輯路由器更新稽核事件

從擷取任何更新事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。

邏輯路由器刪除稽核事件

從擷取任何刪除事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。

邏輯路由器稽核詳細資料 所有邏輯路由器稽核事件。
邏輯路由器 - Manager 錯誤 報告給 NSX Manager 的邏輯路由器記錄錯誤。錯誤依主機名稱進行分組。
邏輯路由器 - Controller 錯誤 NSX Controller 偵測的邏輯路由器記錄錯誤。錯誤依主機名稱進行分組。
邏輯路由器 - 傳輸節點錯誤 NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 的邏輯路由器記錄錯誤。錯誤依節點進行分組。
表 5. NSX - 分散式防火牆概觀
Widget 名稱 備註
區段建立事件

所有防火牆區段建立稽核事件。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

區段更新事件

所有防火牆區段更新稽核事件。

附註 - 對規則執行的任何建立、更新和刪除活動都會引發區段更新事件。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

區段刪除事件

所有防火牆區段刪除稽核事件。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

區段稽核詳細資料

顯示所有防火牆稽核事件 (誰變更了什麼)。

附註 - 對規則執行的任何建立、更新和刪除活動都會引發區段更新事件。

防火牆 - Manager 錯誤 報告給 NSX Manager 的防火牆記錄錯誤。錯誤依主機名稱進行分組。
防火牆 - Controller 錯誤 報告給 NSX Controller 的防火牆記錄錯誤。錯誤依主機名稱進行分組。
防火牆 - 傳輸節點錯誤 NSX 傳輸節點 (vSphere 主機和 KVM 主機) 上的防火牆記錄錯誤。錯誤依節點進行分組。
表 6. NSX - 分散式防火牆流量
Widget 名稱 備註
最高排名防火牆來源 所有正在記錄資料的防火牆規則中最高排名的來源 IP 位址。
最高排名防火牆目的地 所有正在記錄資料的防火牆規則中最高排名的目的地 IP 位址。
允許的應用程式連接埠 依目的地連接埠衡量 NSX-T 環境中允許的所有傳入/傳出連線。該資料是指定的時間範圍的總和。
拒絕的應用程式連接埠 防火牆規則拒絕的所有流量。資料依應用程式 (或目的地) 連接埠號碼進行分組。此 Widget 僅顯示與連接埠相關聯的資料。不會顯示不含相關聯連接埠的流量類型,例如 ICMP。
依位元組的最高排名防火牆來源 - 用戶端到伺服器 依來源 IP 位址的從用戶端到伺服器的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名防火牆目的地 - 用戶端到伺服器 依目的地 IP 位址的從用戶端到伺服器的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名防火牆來源 - 伺服器到用戶端 依來源 IP 位址的從伺服器到用戶端的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名防火牆目的地 - 伺服器到用戶端 依目的地 IP 位址的從伺服器到用戶端的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
表 7. NSX - DHCP
Widget 名稱 備註
DHCP 建立稽核事件

所有 DHCP 都會建立稽核事件,包括新的 DHCP 設定檔、靜態繫結或 IP 集區。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

DHCP 更新稽核事件

所有 DHCP 都會更新稽核事件,包括更新的 DHCP 設定檔、靜態繫結和 IP 集區。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

DHCP 刪除稽核事件

所有 DHCP 都會刪除稽核事件,包括刪除的 DHCP 設定檔、靜態繫結或 IP 集區。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。

DHCP 稽核詳細資料 所有 DHCP 稽核事件。
DHCP - Manager 錯誤 NSX Manager 報告的 DHCP 記錄錯誤。
DHCP - Controller 錯誤 NSX Controller 報告的 DHCP 記錄錯誤。
DHCP - 傳輸節點錯誤 NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 報告的 DHCP 記錄錯誤。
表 8. NSX - 備份
Widget 名稱 備註
備份組態更新 對備份組態進行更新的總次數。
備份失敗 在一段時間內依錯誤碼進行分組的所有備份失敗的計數。
成功的叢集備份 成功完成的叢集和節點備份總數。
失敗的叢集備份 失敗的叢集和節點備份總數。
成功的詳細目錄備份 成功完成的詳細目錄備份總數。
失敗的詳細目錄備份 失敗的詳細目錄備份總數。
表 9. NSX - IPAM
Widget 名稱 備註
IPAM 建立事件

從擷取任何建立事件的 NSX 稽核記錄中摘要的 IPAM 訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。

IPAM 更新事件

從擷取任何更新事件的 NSX 稽核記錄中摘要的 IPAM 訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。

IPAM 刪除事件

從擷取任何刪除事件的 NSX 稽核記錄中摘要的 IPAM 訊息。

附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。

IPAM 稽核詳細資料 所有 IPAM 稽核事件。
IPAM - Manager 錯誤 NSX Manager 報告的 IPAM 記錄錯誤。
表 10. NSX - 統一安全性流量記錄
Widget 名稱 備註
最高排名的安全性類別來源 所有正在記錄資料的安全性類別中最高排名的來源 IP 位址。
最高排名的安全性類別目的地 所有正在記錄資料的安全性類別中最高排名的目的地 IP 位址。
允許的應用程式連接埠 依目的地連接埠衡量 NSX-T 環境中允許的所有傳入/傳出連線。該資料是指定的時間範圍的總和。
拒絕的應用程式連接埠 安全性類別規則拒絕的所有安全性流量。資料依應用程式 (或目的地) 連接埠號碼進行分組。此 Widget 僅顯示與連接埠相關聯的資料。不會顯示不含相關聯連接埠的流量類型,例如 ICMP。
依位元組的最高排名安全性類別來源 - 用戶端到伺服器 依來源 IP 位址的從用戶端到伺服器的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名安全性類別目的地 - 用戶端到伺服器 依目的地 IP 位址的從用戶端到伺服器的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名安全性類別來源 - 伺服器到用戶端 依來源 IP 位址的從伺服器到用戶端的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。
依位元組的最高排名安全性類別目的地 - 伺服器到用戶端 依目的地 IP 位址的從伺服器到用戶端的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。