您可以使用 NSX-T Data Center 中的支援服務包功能,從 Antrea 容器叢集節點收集記錄檔,以便進行詳細的疑難排解和診斷。

NSX-T 可將支援服務包上傳至您從中觸發了支援服務包收集要求的 NSX Manager 節點,也可以將支援服務包上傳至您指定於要求中的遠端檔案伺服器。如果已將支援服務包上傳至 NSX Manager 節點,您可以將其下載到本機電腦。

Antrea 容器叢集的支援服務包中包含以下元件的記錄檔:
  • Antrea 控制器
  • Antrea 代理程式
  • 管理平面介面卡
  • 中央控制平面介面卡
  • Open vSwitch
支援和不支援的功能
  • 透過 NSX Manager 節點,您只能啟動單一支援服務包收集要求。但是,您可以利用單一收集要求,來收集多個 Antrea 容器叢集的支援服務包。
  • 如果您使用的 NSX Manager 叢集有三個管理節點,則可以從各個 NSX Manager 節點同時啟動單獨的支援服務包收集要求。但是,您在每個收集要求中選取的容器叢集必須不同。

    例如,假設您已在 NSX Manager 節點 A 上啟動了支援服務包收集要求。在此收集要求中,您從容器叢集 X 中選取了容器叢集節點 1 和 2。與此同時,如果您在 NSX Manager 節點 B 上,針對容器叢集 X 中容器叢集節點 3 和 4 啟動第二項收集要求,則這兩項收集要求中會有一項要求失敗。您必須等待第一項收集要求完成後,再針對同一容器叢集觸發第二項要求。

  • Antrea 容器叢集目前不支援透過 NSX Manager 中央 CLI 來收集支援服務包。

必要條件

已將 Antrea 容器叢集登錄到 NSX-T Data Center

程序

  1. 從瀏覽器登入 NSX Manager (網址:https://nsx-manager-ip-address)。
  2. 導覽到系統 > 支援服務包
    隨即會開啟 要求服務包頁面。
  3. 選取要包含在支援服務包要求中的目標節點。
    可用的節點類型包括:
    • Antrea 容器叢集
    • NSX Manager 節點
    • Edge
    • 主機
    • 公有雲閘道

    單一支援服務包要求可以混合包含 NSX-T 環境中不同類型的節點。例如,您可以在同一個收集要求中選取 Antrea 容器叢集中的節點、NSX Manager 節點和 NSX Edge 節點。但是,此程序的範圍是為了說明僅用於為 Antrea 容器叢集建立支援服務包收集要求的工作流程。

  4. 類型下拉式功能表中,選取 Antrea 容器叢集
  5. 容器叢集清單中,選取容器叢集的名稱。
    如果清單中包含一些可供選取的容器叢集,請輸入容器叢集名稱的前幾個字元。系統會篩選清單,然後只顯示與所輸入字元相符的容器叢集名稱。
    所選容器叢集中的所有節點會顯示在 可用清單中。
  6. 從容器叢集中選取一或多個節點,然後按一下向右箭頭以將其移到已選取清單中。
    若要在單一收集要求中選取多個 Antrea 容器叢集中的節點,請對每個容器叢集重複步驟 4 和步驟 5。
  7. (選擇性) 記錄存留期 (天) 文字方塊中,您可以保留預設值,或者輸入記錄要包含在支援服務包中的特定天數。將記錄存留期指定為特定天數。
  8. (選擇性) 若要將支援服務包上傳至遠端檔案伺服器,請指定檔案伺服器設定。
    1. 輸入遠端檔案伺服器的 IP 位址或主機名稱。
    2. 輸入檔案傳輸通訊協定和連接埠號碼。預設連接埠號碼為 22。
    3. 輸入用來存取遠端檔案伺服器的使用者名稱和密碼。
    4. 輸入要作為支援服務包檔案上傳目的地的資料夾路徑。
    如果未指定遠端檔案伺服器設定,則會將支援服務包上傳到 NSX Manager 節點,您就是從這裡觸發支援服務包收集要求。
  9. 按一下啟動服務包收集
    收集要求的執行階段詳細資料會顯示在 狀態頁面上。收集程序需要幾分鐘時間才會完成。建立支援服務包所需的時間,取決於要從容器叢集中的每個節點所收集的記錄檔數量。
  10. 收集程序完成後,按一下下載
    支援服務包檔案會儲存在您的本機電腦上。如果您已指定遠端檔案伺服器設定,則不會在 UI 中顯示 下載按鈕。

結果

支援服務包收集要求會使用以下檔案命名慣例來產生單一磁帶封存 (TAR) 檔案:nsx_support_archive_datestamp_timestamp.tar

遇到以下情況時,支援服務包收集要求會失敗:
  • 如果在處理支援服務包要求期間,容器叢集上的 Antrea NSX 介面卡 失敗,則該容器叢集的記錄收集會失敗。
  • 如果在處理支援服務包要求期間,NSX Manager 應用裝置失敗或無法存取,則記錄收集會失敗。在解決與 NSX Manager 的連線問題之前,您可以使用 Antrea 的原生命令列工具 (antctl) 從 Antrea 容器叢集收集記錄檔案。
部分成功案例
設想您從單一 Antrea 容器叢集中選取了 10 個節點,來收集支援服務包。在收集過程中,系統從該容器叢集的五個節點中成功收集到記錄檔,但未能從其餘五個節點中收集到記錄檔。換句話說,收集要求僅部分成功。在此情況下,收集要求狀態為 成功,且支援服務包檔案 (TAR) 含有 5 個成功節點的記錄。

下一步

  1. 擷取 TAR 檔案。隨即會顯示以下檔案。
    檔案名稱 說明
    manifest.json

    此檔案包含收集要求結果摘要以及收集要求屬性。

    例如,其包含有關以下內容的資訊:
    • 成功完成收集的節點。
    • 收集失敗的節點。
    • 收集要求中所使用的叢集識別碼和節點識別碼。
    nsx_antrea_cluster-id.tgz

    在支援服務包中,系統會為每個 Antrea 容器叢集建立一個 .tgz 封存檔。

  2. 擷取 nsx_antrea_cluster-id.tgz 檔案。隨即會顯示以下檔案。
    檔案名稱 說明
    adapters.tar.gz

    此封存檔包含管理平面介面卡中央控制平面介面卡的記錄檔。

    agent_node_name.tar.gz

    此封存檔包含 Antrea 代理程式和 Open vSwitch 的記錄檔。在收集要求中,系統會為每個容器叢集節點產生一個封存檔。

    在擷取此封存檔時,您可以檢視以下檔案:
    • agentinfo 檔案
    • 位於 /logs/agent 的代理程式記錄
    • 位於 /logs/ovs 的 Open vSwitch 記錄
    • OpenFlow 傾印
    • IPtables
    • 路由傾印
    clusterinfo

    系統會為支援服務包要求中的每個容器叢集產生此檔案。檔案含有從 Kubernetes API 伺服器收集之各種 Kubernetes 資源的相關資訊,例如:網繭、節點、部署、ReplicaSet、DaemonSet 等資源。

    controller.tar.gz

    此封存檔包含 Antrea 控制器 的記錄檔。

    在擷取此封存檔時,您可以檢視以下檔案:
    • controllerinfo 檔案
    • 位於 /logs/controller 的控制器記錄