您可以使用 Aria Operations for Logs 或 Splunk 來監控 NSX 環境。
您可以在 https://splunkbase.splunk.com/app/4241 找到 NSX Splunk 應用程式。
Aria Operations for Logs 內容套件具有下列警示:
警示名稱 | 說明 |
---|---|
SysCpuUsage | CPU 使用率高於 95% 且超過 10 分鐘。 |
SysMemUsage | 記憶體使用量高於 95% 且超過 10 分鐘。 |
SysDiskUsage | 一或多個磁碟分割的磁碟使用量高於 89% 且超過 10 分鐘。 |
PasswordExpiry | 應用裝置使用者帳戶的密碼即將到期或已到期。 |
CertificateExpiry | 一或多個 CA 簽署的憑證已到期。 |
ClusterNodeStatus | 本機 Edge 叢集節點已關閉。 |
BackupFailure | NSX 排程的備份作業失敗。 |
VipLeadership | NSX 管理叢集 VIP 已關閉。 |
ApiRateLimit | 用戶端 API 已達到設定的臨界值。 |
CorfuQuorumLost | 叢集中的兩個節點已關閉,且遺失 corfu 仲裁。 |
DfwHeapMem | DFW 堆積記憶體已超過設定的臨界值。 |
ProcessStatus | 重要處理程序狀態已變更。 |
ClusterFailoverStatus | SR 高可用性狀態已變更或作用中/待命服務容錯移轉。 |
DhcpPoolUsageOverloadedEvent | DHCP 集區已達到設定的使用量臨界值。 |
FabricCryptoStatus | Edge 加密 mux 驅動程式已針對失敗的 Known_Answer_Tests (KAT) 關閉。 |
VpnTunnelState | VPN 通道已關閉。 |
BfdTunnelStatus | BFD 通道狀態已變更。 |
RoutingBgpNeighborStatus | BGP 芳鄰狀態為關閉。 |
VpnL2SessionStatus | L2 VPN 工作階段已關閉。 |
VpnIkeSessionStatus | IKE 工作階段已關閉。 |
RoutingStatus | 路由 (BGP/BFD) 已關閉。 |
DnsForwarderStatus | DNS 轉寄站執行狀態為關閉。 |
TnConnDown_15min | 對控制器/管理程式的傳輸節點連線已關閉,且已持續至少 15 分鐘。 |
TnConnDown_5min | 對控制器/管理程式的傳輸節點連線已關閉,且已持續至少 5 分鐘。 |
ServiceDown | 一或多個服務已關閉。 |
IpNotAvailableInPool | 集區中沒有可用的 IP 或已達到設定的臨界值。 |
LoadBalancerError | NSX 負載平衡器服務狀態為錯誤。 |
LoadBalancerDown | NSX 負載平衡器服務狀態為關閉。 |
LoadBalancerVsDown | VS 狀態:所有集區成員已關閉。 |
LoadBalancerPoolDown | 集區狀態:所有集區成員已關閉。 |
ProcessCrash | 在資料路徑或其他 LB 處理程序 (如發送器等) 中,處理程序或精靈當機。 |
儀表板
Splunk 應用程式和 Aria Operations for Logs 內容套件都具有下列儀表板。
Widget 名稱 | 備註 |
---|---|
NSX Manager:通訊錯誤 | 這些是 NSX Manager 上的所有通訊記錄錯誤。這些錯誤依主機名稱進行分組。 |
傳輸節點 - NSX Manager:通訊錯誤 | NSX 傳輸節點 (vSphere 主機、KVM 主機和 NSX Edge) 和 NSX Manager 之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。 |
傳輸節點 - 控制器:通訊錯誤 | NSX 傳輸節點 (vSphere 主機、KVM 主機和 NSX Edge) 和 NSX Controller 之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。 |
控制器:通訊錯誤 | 叢集中控制器之間的通訊錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。 |
組態錯誤 | 此 Widget 以建立 NSX 基礎結構的各種元件所產生的已知錯誤模式為基礎。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。 |
其他錯誤 | 所有 NSX 元件中的其他錯誤。建議對傳回值最高的主機名稱進行分析以尋找潛在問題。主機代理程式失敗 (如 netcpa 關閉或 MPA 關閉) 可能需要立即採取行動。 |
Widget 名稱 | 備註 |
---|---|
邏輯交換器稽核 | 從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。 |
邏輯交換器稽核詳細資料 | 所有邏輯交換器稽核事件。此 Widget 以建立 NSX 邏輯交換器基礎結構的各種元件所產生的已知錯誤模式為基礎。 |
邏輯交換器連接埠稽核 | 從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯交換器連接埠訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器連接埠稽核事件的通用計數。 |
邏輯交換器連接埠稽核詳細資料 | 所有邏輯交換器連接埠稽核事件。此 Widget 以建立 NSX 邏輯交換器基礎結構的各種元件所產生的已知錯誤模式為基礎。 |
邏輯路由器稽核 | 從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。 |
邏輯路由器稽核詳細資料 | 所有邏輯路由器稽核事件。此 Widget 以建立 NSX 邏輯路由基礎結構的各種元件所產生的已知錯誤模式為基礎。 |
邏輯路由器連接埠稽核 | 從擷取任何建立、更新或刪除事件的 NSX 稽核記錄中摘要的邏輯路由器連接埠訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器連接埠稽核事件的通用計數。 |
邏輯路由器連接埠稽核詳細資料 | 所有邏輯交換器連接埠稽核事件。此 Widget 以建立 NSX 邏輯路由器基礎結構的各種元件所產生的已知錯誤模式為基礎。 |
防火牆稽核 | 從擷取任何使用新規則新增區段、更新區段或刪除區段事件的 NSX 稽核記錄中摘要的防火牆訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆稽核事件的通用計數。 |
邏輯防火牆稽核詳細資料 | 所有防火牆稽核事件。此 Widget 以 NSX 防火牆所產生的已知錯誤模式為基礎。 |
NSX - 邏輯交換器 | 備註 |
---|---|
已建立邏輯交換器 | 從擷取任何建立事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。 |
邏輯交換器更新 | 從擷取任何更新事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。 |
已刪除邏輯交換器 | 從擷取任何刪除事件的 NSX 稽核記錄中摘要的邏輯交換器訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯交換器稽核事件的通用計數。 |
邏輯交換器稽核詳細資料 | 所有邏輯交換器稽核事件。 |
邏輯交換器 - Manager 錯誤 | 報告給 NSX Manager 的邏輯交換器記錄錯誤。錯誤依主機名稱進行分組。 |
邏輯交換器 - Controller 錯誤 | 從 NSX Controller 檢視中報告的邏輯交換器記錄錯誤。錯誤依主機名稱進行分組。 |
邏輯交換器 - 傳輸節點錯誤 | 所有 NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 報告的邏輯交換器記錄錯誤。錯誤依節點進行分組。 |
Widget 名稱 | 備註 |
---|---|
邏輯路由器建立稽核事件 | 從擷取任何建立事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。 |
邏輯路由器更新稽核事件 | 從擷取任何更新事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。 |
邏輯路由器刪除稽核事件 | 從擷取任何刪除事件的 NSX 稽核記錄中摘要的邏輯路由器訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供邏輯路由器稽核事件的通用計數。 |
邏輯路由器稽核詳細資料 | 所有邏輯路由器稽核事件。 |
邏輯路由器 - Manager 錯誤 | 報告給 NSX Manager 的邏輯路由器記錄錯誤。錯誤依主機名稱進行分組。 |
邏輯路由器 - Controller 錯誤 | NSX Controller 偵測的邏輯路由器記錄錯誤。錯誤依主機名稱進行分組。 |
邏輯路由器 - 傳輸節點錯誤 | NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 的邏輯路由器記錄錯誤。錯誤依節點進行分組。 |
Widget 名稱 | 備註 |
---|---|
區段建立事件 | 所有防火牆區段建立稽核事件。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。 |
區段更新事件 | 所有防火牆區段更新稽核事件。 附註 - 對規則執行的任何建立、更新和刪除活動都會引發區段更新事件。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。 |
區段刪除事件 | 所有防火牆區段刪除稽核事件。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。 |
區段稽核詳細資料 | 顯示所有防火牆稽核事件 (誰變更了什麼)。 附註 - 對規則執行的任何建立、更新和刪除活動都會引發區段更新事件。 |
防火牆 - Manager 錯誤 | 報告給 NSX Manager 的防火牆記錄錯誤。錯誤依主機名稱進行分組。 |
防火牆 - Controller 錯誤 | 報告給 NSX Controller 的防火牆記錄錯誤。錯誤依主機名稱進行分組。 |
防火牆 - 傳輸節點錯誤 | NSX 傳輸節點 (vSphere 主機和 KVM 主機) 上的防火牆記錄錯誤。錯誤依節點進行分組。 |
Widget 名稱 | 備註 |
---|---|
最高排名防火牆來源 | 所有正在記錄資料的防火牆規則中最高排名的來源 IP 位址。 |
最高排名防火牆目的地 | 所有正在記錄資料的防火牆規則中最高排名的目的地 IP 位址。 |
允許的應用程式連接埠 | 依目的地連接埠衡量 NSX-T 環境中允許的所有傳入/傳出連線。該資料是指定的時間範圍的總和。 |
拒絕的應用程式連接埠 | 防火牆規則拒絕的所有流量。資料依應用程式 (或目的地) 連接埠號碼進行分組。此 Widget 僅顯示與連接埠相關聯的資料。不會顯示不含相關聯連接埠的流量類型,例如 ICMP。 |
依位元組的最高排名防火牆來源 - 用戶端到伺服器 | 依來源 IP 位址的從用戶端到伺服器的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。 |
依位元組的最高排名防火牆目的地 - 用戶端到伺服器 | 依目的地 IP 位址的從用戶端到伺服器的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。 |
依位元組的最高排名防火牆來源 - 伺服器到用戶端 | 依來源 IP 位址的從伺服器到用戶端的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。 |
依位元組的最高排名防火牆目的地 - 伺服器到用戶端 | 依目的地 IP 位址的從伺服器到用戶端的所有防火牆流量 (以位元組為單位)。僅當防火牆正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。 |
Widget 名稱 | 備註 |
---|---|
DHCP 建立稽核事件 | 所有 DHCP 都會建立稽核事件,包括新的 DHCP 設定檔、靜態繫結或 IP 集區。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。 |
DHCP 更新稽核事件 | 所有 DHCP 都會更新稽核事件,包括更新的 DHCP 設定檔、靜態繫結和 IP 集區。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。 |
DHCP 刪除稽核事件 | 所有 DHCP 都會刪除稽核事件,包括刪除的 DHCP 設定檔、靜態繫結或 IP 集區。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供防火牆變更的通用計數。 |
DHCP 稽核詳細資料 | 所有 DHCP 稽核事件。 |
DHCP - Manager 錯誤 | NSX Manager 報告的 DHCP 記錄錯誤。 |
DHCP - Controller 錯誤 | NSX Controller 報告的 DHCP 記錄錯誤。 |
DHCP - 傳輸節點錯誤 | NSX 傳輸節點 (vSphere 主機、KVM 主機和 Edge 服務閘道) 報告的 DHCP 記錄錯誤。 |
Widget 名稱 | 備註 |
---|---|
備份組態更新 | 對備份組態進行更新的總次數。 |
備份失敗 | 在一段時間內依錯誤碼進行分組的所有備份失敗的計數。 |
成功的叢集備份 | 成功完成的叢集和節點備份總數。 |
失敗的叢集備份 | 失敗的叢集和節點備份總數。 |
成功的詳細目錄備份 | 成功完成的詳細目錄備份總數。 |
失敗的詳細目錄備份 | 失敗的詳細目錄備份總數。 |
Widget 名稱 | 備註 |
---|---|
IPAM 建立事件 | 從擷取任何建立事件的 NSX 稽核記錄中摘要的 IPAM 訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。 |
IPAM 更新事件 | 從擷取任何更新事件的 NSX 稽核記錄中摘要的 IPAM 訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。 |
IPAM 刪除事件 | 從擷取任何刪除事件的 NSX 稽核記錄中摘要的 IPAM 訊息。 附註:事件可能會重複,因為它們是在多個 NSX 記錄器中產生的。因此,此 Widget 將提供 IPAM 稽核事件的通用計數。 |
IPAM 稽核詳細資料 | 所有 IPAM 稽核事件。 |
IPAM - Manager 錯誤 | NSX Manager 報告的 IPAM 記錄錯誤。 |
Widget 名稱 | 備註 |
---|---|
最高排名的安全性類別來源 | 所有正在記錄資料的安全性類別中最高排名的來源 IP 位址。 |
最高排名的安全性類別目的地 | 所有正在記錄資料的安全性類別中最高排名的目的地 IP 位址。 |
允許的應用程式連接埠 | 依目的地連接埠衡量 NSX-T 環境中允許的所有傳入/傳出連線。該資料是指定的時間範圍的總和。 |
拒絕的應用程式連接埠 | 安全性類別規則拒絕的所有安全性流量。資料依應用程式 (或目的地) 連接埠號碼進行分組。此 Widget 僅顯示與連接埠相關聯的資料。不會顯示不含相關聯連接埠的流量類型,例如 ICMP。 |
依位元組的最高排名安全性類別來源 - 用戶端到伺服器 | 依來源 IP 位址的從用戶端到伺服器的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。 |
依位元組的最高排名安全性類別目的地 - 用戶端到伺服器 | 依目的地 IP 位址的從用戶端到伺服器的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。 |
依位元組的最高排名安全性類別來源 - 伺服器到用戶端 | 依來源 IP 位址的從伺服器到用戶端的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。 |
依位元組的最高排名安全性類別目的地 - 伺服器到用戶端 | 依目的地 IP 位址的從伺服器到用戶端的所有安全性流量 (以位元組為單位)。僅當類別正在記錄其資料時,才會顯示資料。該資料是指定的時間範圍的總和。 |