本主題介紹 VMware Aria Operations 中不同類型的警示、如何存取這些警示以及如何檢視有關這些警示的更多資訊。
警示的類型
VMware Aria Operations 中的警示分成三種類型。警示類型決定問題的嚴重性。
- 健全狀態警示
- 健全狀況警示清單包含所有已產生的警示,這些警示設定會對您環境的健全狀況造成影響,需要您立即注意。使用健全狀況警示清單來評估、排列優先順序並立即開始解決問題。
- 風險警示
- 風險警示清單包括所有已產生的警示,這些警示設定為指示您環境中的風險。在近期內解決風險警示,以防產生警示的觸發症狀對環境的健全狀況造成負面影響。
- 效率警示
- 效率警示清單包含所有已產生的警示,這些警示設定為指示環境中受監控物件的使用效率問題。解決效率警示以回收浪費的空間或提升環境中的物件效能。
存取警示 VMware Aria Operations
所有警示或管理警示頁面提供了 VMware Aria Operations 中產生的所有警示的清單。使用警示清單可判定環境的狀態並開始解決問題。
找到 [所有警示] 頁面的位置
從左側功能表中,按一下
。找到 [管理警示] 頁面的位置
身為管理員,您可以透過按一下 [警示] 功能表旁的警告圖示或從左側功能表中按一下管理警示索引標籤來檢視管理警示。您必須是全域 Admin 使用者或已獲指派管理權限,才能檢視管理警示頁面。
並按一下[所有警示] 和 [管理警示] 頁面的運作方式
依預設,一開始僅會列出作用中的警示,警示會依時間分組。使用工具列選項檢閱和管理清單中的警示。按住 Shift 再按一下或按住 Ctrl 再按一下,即可選取清單中的多列。
若要查看警示詳細資料,請按一下警示名稱。警示詳細資料會顯示在右側,包括該警示觸發的症狀。系統會提供因應警示的建議,以及用以執行建議的連結。[執行動作] 按鈕可能會出現在詳細資料中。將游標暫留在按鈕上,即可瞭解如果按一下按鈕會執行哪項建議。或者,您可以檢視在警示資料格中的執行按鈕和建議的修正。您可依據已啟用 [執行] 選項的警示來進行篩選,並執行建議的工作,以處理警示資料格中的警示。按一下警示清單左下方的小方塊,以在資料格中包含建議的修正和執行資料行。
按一下產生警示之物件的名稱,即可查看物件詳細資料,以及存取與度量和事件相關的其他資訊。
如果您從舊版 VMware Aria Operations 移轉警示,列出的警示會出現已取消狀態,而且不會提供警示詳細資料。
所有警示和管理警示選項
警示選項包括工具列與資料格選項。使用工具列選項可排序警示清單,以及取消、暫停或管理擁有權。使用資料格可檢視警示和警示詳細資料。
從清單中選取警示以啟用 [動作] 功能表。
選項 | 說明 |
---|---|
取消警示 | 取消所選警示。如果您將警示清單設定為僅顯示使用中的警示,則會從該清單中移除已取消的警示。 當您不需要處理警示時,可以取消。取消警示不會取消產生警示的基礎條件。如果警示是由錯誤和事件症狀所觸發,則取消警示是有效的,因為只有在受監控物件上發生後續的錯誤或事件時,才會再度觸發這些症狀。如果警示是根據度量或內容症狀產生,則只有在下一個收集和分析週期時,才會取消警示。如果違反的值仍然存在,會再度產生警示。 |
刪除已取消的警示 | 刪除已取消 (非作用中) 的警示 (可一次選擇一組警示,也可個別選擇一個警示)。作用中警示會停用此選項。 |
暫停 | 將警示暫停指定的分鐘數。 調查警示時,若您正在工作,且不想讓警示影響物件的健全狀況、風險或效率,您可暫停警示。如果一段時間後問題仍存在,警示將重新啟動,並且將會再次影響物件的健全狀況、風險或效率。 暫停該警示的使用者則成為指派的擁有者。 |
指派給 | 指派警示給使用者。您可以搜尋特定的使用者名稱,然後按一下儲存,將警示指派給所選使用者。 |
取得擁有權 | 做為目前的使用者,您可以讓自己成為該警示的擁有者。 您僅可取得一個警示的擁有權,無法指派擁有權。 |
釋放擁有權 | 會釋放警示的所有擁有權。 |
前往警示定義 | 切換到 [警示定義] 頁面,以顯示先前所選取警示的定義。 |
停用... | 提供了兩個用於停用警示的選項:
備註: 若要啟用 [停用] 選項,請從
分組依據下拉式清單中選取
定義,然後按一下警示定義群組的名稱。
|
開啟外部應用程式 | 可以在所選物件上執行的動作。 例如,在 vSphere Client 中開啟虛擬機器。 |
選項 | 說明 |
---|---|
無 | 警示不會分成特定群組。 |
時間 | 警示依觸發的時間分組。這是預設的選項。您也可以依「1 小時」、「4 小時」、「今天與昨天」、「本週」、「上週」以及「更早」加以分組。 |
嚴重度 | 警示依嚴重度分組。值包括 (從最不嚴重的開始):資訊/警告/急迫/嚴重。另請參閱下表「所有警示資料格」選項中的嚴重度。 |
定義 | 警示依定義分組,也就是將類似的警示分在同一組。 |
物件類型 | 警示依觸發警示的物件類型分組。例如將主機的警示分組在一起。 |
範圍 | 警示依範圍分組。您可以在所選範圍內搜尋警示。 |
快速篩選器 | 說明 |
---|---|
篩選選項 | 將警示清單限制為與您選擇的篩選器相符的警示。 例如,您可能已在 [分組依據] 功能表中選擇 [時間] 選項。現在,您可以在 [快速篩選器] 功能表中選擇 [狀態] -> [作用中],[所有警示]/[管理警示] 將僅顯示作用中警示,並依觸發時間排序。 |
選項 (如需更多篩選器定義,另請參閱 [分組依據] 和 [所有警示資料格] 資料表) | |
警示識別碼 | 為警示指定的識別碼。 |
警示 | 產生該警示的警示定義的名稱。 |
擁有者 | 擁有該警示的操作者名稱。 |
影響 | 警示徽章受到警示影響。受影響的徽章、健全狀況、風險或效率,會針對識別的問題指出緊急程度。 |
警示子類型 | 有關在所選物件上觸發的警示類型的其他資訊。這有助於按 [警示類型] 以外的詳細層級對警示進行分類,以便將某些類型的警示指派給特定的系統管理員。例如,可用性、效能、容量、符合性和組態。 |
狀態 | 警示的目前狀態。 可能的值包括 [使用中] 或 [已取消]。 |
嚴重度 | 警示在您環境中的重要性層級。 此層級以建立警示定義時所指派的層級為基礎,或以最高症狀嚴重度為基礎 (若指派的層級為以症狀為基礎)。
可能的值包括:
|
觸發於 | 為其產生警示的物件名稱,以及物件類型 (當您將游標暫留在物件名稱上時,會出現在工具提示中)。 按一下物件名稱可檢視物件詳細資料索引標籤,您可以從中開始調查物件的任何其他問題。 |
控制狀態 |
與警示互動的使用者狀態。可能的值包括:
|
物件類型 | 產生警示的物件類型。 |
建立於 | 產生警示時的日期和時間。 |
更新於 | 上次修改警示的日期和時間。
不論何時出現下列任一項變更,警示都會更新:
|
取消於 |
出於下列其中一個原因而取消警示的日期和時間:
|
動作 | 選擇是以依據已啟用執行選項的警示來進行篩選。選擇否以依據已停用執行選項的警示來進行篩選。 |
警示資料格會提供所產生警示的清單,可用於解決環境中的問題。每個資料行標題中的箭號可決定依遞增或遞減順序排序清單。
選項 | 說明 |
---|---|
嚴重度 | 嚴重度是環境中警示的重要性層級。 此層級以建立警示定義時所指派的層級為基礎,或以最高症狀嚴重度為基礎 (若指派的層級為以症狀為基礎)。
可能的值包括:
|
警示 | 產生該警示的警示定義的名稱。 按一下警示名稱,即可在右側顯示警示詳細資料。 |
觸發於 | 為其產生警示的物件名稱,以及物件類型 (當您將游標暫留在物件名稱上時,會出現在工具提示中)。 按一下物件名稱可檢視物件詳細資料索引標籤,您可以從中開始調查物件的任何其他問題。 |
建立於 | 產生警示時的日期和時間。 |
狀態 | 警示的目前狀態。 可能的值包括 [使用中] 或 [已取消]。 |
警示類型 | 說明在所選物件上觸發的警示類型,並協助您對警示進行分類,以便將某些警示類型指派給特定系統管理員。例如,應用程式、虛擬化/Hypervisor、硬體、儲存區、網路、管理和發現。 |
警示子類型 | 說明有關所選物件上觸發之警示類型的其他資訊,並協助您對警示進行比警示類型更進一步的分類,以便將某些警示類型指派給特定系統管理員。例如,可用性、效能、容量、符合性和組態。 |
重要性 | 顯示警示的優先順序。警示的重要等級是使用智慧排名演算法來決定的。 |
建議的修正 | 顯示如何處理警示的建議。 |
動作 | 按一下此按鈕,以執行處理警示的建議。 |
檢視警示資訊
當您按一下所有警示清單中的 [警示] 時,警示資訊會顯示在右側。請檢視警示資訊,以瞭解觸發警示的症狀、修正基本問題的建議,以及疑難排解發生警示的原因。
檢視警示資訊的不同方式
- 從左側功能表中,按一下 ,然後按一下警示清單中的某個警示。
- 請從左選單按一下警示索引標籤。 ,然後選擇一個組、自訂資料中心、應用程式或清單物件。按一下物件,然後按一下
- 在功能表中選取 [搜尋] 並找到感興趣的物件。按一下物件,然後按一下警示索引標籤。
- [警示詳細資料] 索引標籤
-
區段 說明 建議 檢視警示的建議。按一下 < 或 > 以瀏覽建議。若要解決警示,請按一下執行動作按鈕 (若有顯示)。 其他建議 摺疊區段以檢視其他建議。請參閱需要更多資訊?區段中的連結,以檢視其他度量、事件或顯示為連結的其他詳細資料。 警示基礎 僅限作用中 依預設,此選項處於啟用狀態。如果啟用,將顯示滿足的所有作用中警示症狀/條件。如果停用,將顯示警示的所有症狀/條件。 症狀 檢視已觸發警示的症狀。摺疊每個症狀以檢視其他資訊。 條件 檢視已觸發警示的條件。摺疊每個條件以檢視其他資訊。 附註 輸入有關警示的備註,然後按一下提交以儲存。 關閉 按一下 X 圖示以關閉警示詳細資料索引標籤。 - [相關警示] 索引標籤
-
右側顯示的相關範圍會顯示觸發警示之物件上一層和下一層的物件。此拓撲已修正。您無法在相關警示索引標籤中變更範圍。
您會在右側看到下列內容:- 物件是否在過去 30 天內觸發了相同的警示。這可協助您瞭解這是週期性問題還是新的問題。
- 如果在過去 30 天內,相同環境中的其他對等節點觸發了相同的警示。這可協助您快速分析對等節點,瞭解其他節點是否受到相同問題的影響。
- 在目前拓撲中觸發的所有警示。這可協助您調查環境中是否有其他警示產生的上下游問題,影響物件的健全狀況。
- [潛在證據] 索引標籤
-
請參閱潛在證據索引標籤,以找出問題的潛在證據與根本原因。此索引標籤會顯示可能與警示相關的事件、內容變更和異常度量。時間範圍和範圍是固定的。若要修改範圍或時間範圍並進行進一步調查,請按一下啟動工作台。這會執行 [疑難排解工作台]。
[潛在證據] 索引標籤所顯示的時間範圍為觸發警示之前的兩個半小時。VMware Aria Operations 會在此時間範圍內尋找潛在證據。
智慧警示
每個企業都可以設定五個或更多的監控工具,以便全天候監控資料中心作業的各個方面。這可能會導致警示泛濫的情況,即單一監控工具或多個工具針對同一問題產生多個警示。因此,IT 管理員必須篩選數千個警示,以篩選出雜訊並專注於關鍵問題,因此,增加警示的龐大數量並造成警示風暴或警示雜訊,導致團隊無法識別最嚴重的警示。發生警示洪泛的原因是,監控工具缺乏瞭解所有警示所描述的相同問題的智慧。
機器學習 (ML) 透過監控數百萬個度量、大量記錄和應用程式追蹤,幫助自動管理包含數千個物件 (如虛擬機器、主機和資料存放區) 的複雜系統,以擷取整個堆疊的高解析度影像。
VMware Aria Operations 透過智慧警示叢集協助消除由於疑難排解速度不夠快和解決多個物件的嚴重問題而發生的業務停機。
[智慧警示] 索引標籤的位置
從左側功能表中,按一下智慧警示索引標籤。
,然後按一下智慧警示叢集化的運作方式
智慧警示 (在 VMware Aria Operations 中也稱為警示叢集) 會根據相關警示的建立時間和拓撲距離將這些警示分組在一起。相較於處理由相同基礎問題引發的個別警示,此方法可提供更有條理且更有效率的疑難解答方法。警示叢集化是根據 DBScan 演算法完成的。DBScan (具有雜訊的應用程式的密度型空間叢集) 是一種未受監督的叢集機器學習演算法,可嘗試將資料點緊密分組到人工叢集中。在 VMware Aria Operations 環境中,DBScan 量身定製為了一種串流演算法,並設定了特定參數 (例如,最低點設定為 5,時間差設定為 5 分鐘,拓撲距離設定為 1) ,以便僅考慮直接子系和父系。提供智慧型手機警示存留期和物件拓撲這兩個主要檢視,用於警示叢集疑難解答。
選項 | 說明 |
---|---|
篩選器 | 您可以依狀態篩選警示叢集。從狀態下拉式清單中選取作用中或非作用中,然後按一下套用。 |
警示叢集 | 警示叢集卡會顯示下列內容:
|
物件 | 根物件的名稱。 |
開始時間/結束時間 | 警示叢集的開始時間即為識別出第一個滿足叢集條件之叢集的時間。警示叢集的結束時間,即為叢集不再符合警示叢集資格的時間。 |
警示/物件 | 選取警示可以圖形方式檢視特定時段內的警示。 選取物件可檢視警示叢集的物件-關聯性圖表。將游標暫留在該物件上,然後按一下詳細資料,可開啟物件的摘要頁面。 |
如何開始 | 按一下啟動方式可檢視警示叢集的生命週期。每個氣泡會顯示警示和物件,將游標暫留在氣泡上方以檢視更多詳細數據。 |
疑難排解 | 按一下此選項可啟動疑難排解工作台以進行進一步疑難排解。 |
圖表 | 圖表顯示所選警示叢集依時間的警示數目。
點選圖表圖例以篩選警示:
按一下行事曆圖示,然後選取範圍,或在起始時間和結束時間欄位中選取日期,可以檢視過去的警示。 |
分組依據 | 警示可以按下列方式分組:
|
篩選器 | 您可以按下列方式篩選警示:
|