您可以使用 VMware Cloud Director 應用裝置管理使用者介面來監控叢集狀態。
程序
- 以 root 身分登入應用裝置管理使用者介面,網址為:https://primary_eth1_ip_address:5480。
- 在左面板中,選取內嵌式資料庫可用性。
您可以檢視節點的簡短 DNS 名稱、角色、狀態、其上游節點 (即目前的主要節點) 的名稱,以及節點上可用的動作。
在追蹤欄中,主機名稱前面的問號 (?)表示目前主要節點無法連線。主機名稱前面的驚嘆號 (!)表示目前主要節點的中繼資料未更新且可能有誤,或者節點未連結至目前的主要節點。如果在長時間停機後重新啟動節點,則可能會發生此問題。如果節點無法連結至主要節點,則必須將其解除登錄,並將其取代為新的待命節點。
- 檢視叢集健全狀況。
叢集健全狀況狀態 描述 Healthy 叢集處於狀況良好狀態。主要儲存格和兩個待命儲存格處於線上狀態且可運作。
VMware Cloud Director 使用者介面和 API 均正常運作。
Degraded 叢集處於已降級狀態。主要儲存格和其中一個待命儲存格處於線上狀態且可運作,但另一個待命儲存格無法正常運作。主要資料庫在此狀態下可正常運作,但如果任一個可運作的儲存格出現另一個資料庫故障,則主要資料庫將無法正常運作。必須盡快使用新的可運作待命儲存格取代無法正常運作的待命儲存格,才能將叢集還原至
Healthy
狀態。VMware Cloud Director 使用者介面和 API 均正常運作。
No_Active_Primary 沒有可運作的主要資料庫。如果有兩個可運作的待命儲存格,必須將其中一個待命儲存格升階為新的主要儲存格。如果環境中沒有兩個可運作的待命儲存格,則必須診斷問題並手動修復狀況。
VMware Cloud Director使用者介面和 API 無法使用。
Read_Only_Primary 存在一個線上主要資料庫,但由於環境中沒有可運作的待命儲存格,因此顯示為
Read_Only
。必須部署兩個新的待命儲存格。VMware Cloud Director使用者介面和 API 無法使用。
Critical_Problem 叢集處於不一致的狀態。例如,有多個主要儲存格處於線上狀態,或待命儲存格跟隨了錯誤的主要儲存格。您必須診斷問題並手動修復狀況。
此狀態可能會影響 VMware Cloud Director 使用者介面和 API 可用性。
SSH_Problem SSH 問題指示 postgres 使用者無法透過 SSH 連線至其對等資料庫節點。必須盡快修正此嚴重問題。請參閱叢集健全狀況指示 SSH 問題。
VMware Cloud Director 使用者介面和 API 可能無法完全正常運作。
- 檢視應用裝置容錯移轉模式。
容錯移轉模式 描述 自動 如果主要資料庫發生故障,VMware Cloud Director 會自動觸發資料庫容錯移轉。 手動 如果主要資料庫發生故障,則必須使用 VMware Cloud Director 應用裝置管理使用者介面或容錯移轉 API 起始資料庫容錯移轉。 不確定 容錯移轉模式在叢集的所有節點之間不一致。您必須診斷問題並修復狀況。透過使用 VMware Cloud Director 應用裝置 API,將 FailoverMode
重設為Manual
或Automatic
。請參閱VMware Cloud Director 應用裝置 API 架構參考中的容錯移轉模式資訊。