NSX-T Data Center 支援多站台部署,進而您可從一個 NSX Manager 叢集管理所有站台。

支援兩種類型的多站台部署:
  • 災害復原
  • 雙主動

下圖說明災害復原部署。


多站台災難復原部署

在雙主動部署中,所有站台均處於作用中狀態,且第 2 層流量會跨越站台界限。在災害復原部署中,位於主要站台的 NSX-T Data Center 會處理企業的網路。次要站台則會處於備用狀態,以便在主要站台發生災難性失敗時接手。

下圖說明雙主動部署。


多站台雙主動部署

您可以為管理平面和資料平面部署自動或手動/指令碼式復原的兩個站台。

管理平面的自動復原

需求:
  • 在設定的站台間具有 HA 的延伸 vCenter 叢集。
  • 延伸的管理 VLAN。

NSX Manager 叢集會部署在管理 VLAN 上,並且實際位於主要站台中。如果主要站台故障,vSphere HA 將會重新啟動次要站台中的 NSX Manager。所有傳輸節點會自動重新連線至重新啟動的 NSX Manager。此程序需要大約 10 分鐘。在此期間,管理平面無法使用,但資料平面不會受到影響。

下圖說明管理平面的自動復原。

災難之前:

管理平面的自動復原 - 在進行災難復原前

災難復原之後:

管理平面的自動復原 - 在進行災難復原後

資料平面的自動復原

您可以為 Edge 節點設定失敗網域,以實現資料平面的自動復原。您可以將 Edge 叢集內的 Edge 節點分組在不同的失敗網域中。NSX Manager 會自動將任何新的作用中第 1 層閘道置於慣用的失敗網域,以及將待命第 1 層閘道置於另一個網域。

需求:
  • Edge 節點之間的最大延遲時間為 10 毫秒。
  • 第 0 層閘道的 HA 模式必須為主動-待命模式,且容錯移轉模式必須為先佔式。

附註:第 1 層閘道的容錯移轉模式可以是先佔式,也可以是非先佔式。

組態步驟:
  • 使用 API 建立兩個站台的失敗網域,例如 FD1A-Preferred_Site1FD2A-Preferred_Site1。將參數 preferred_active_edge_services 設定為主要站台的 true,並將其設定為次要站台的 false
    POST /api/v1/failure-domains
    {
    "display_name": "FD1A-Preferred_Site1",
    "preferred_active_edge_services": "true"
    }
    
    POST /api/v1/failure-domains
    {
    "display_name": "FD2A-Preferred_Site1",
    "preferred_active_edge_services": "false"
    }
  • 使用 API,設定延伸到兩個站台的 Edge 叢集。例如,叢集在主要站台中有 Edge 節點 EdgeNode1AEdgeNode1B,而在次要站台中有 Edge 節點 EdgeNode2AEdgeNode2B。作用中的第 0 層和第 1 層閘道將在 EdgeNode1AEdgeNode1B 上執行。待命第 0 層和第 1 層閘道將在 EdgeNode2AEdgeNode2B 上執行。
  • 使用 API,將每個 Edge 節點與該站台的失敗網域建立關聯。先呼叫 GET /api/v1/transport-nodes/<transport-node-id> API 以取得有關 Edge 節點的資料。使用 GET API 的結果作為 PUT /api/v1/transport-nodes/<transport-node-id> API 的輸入,並適當地設定其他內容 failure_domain_id。例如,
    GET /api/v1/transport-nodes/<transport-node-id>
    Response:
    {
        "resource_type": "TransportNode",
        "description": "Updated NSX configured Test Transport Node",
        "id": "77816de2-39c3-436c-b891-54d31f580961",
        ...
    }
    
    PUT /api/v1/transport-nodes/<transport-node-id>
    {
        "resource_type": "TransportNode",
        "description": "Updated NSX configured Test Transport Node",
        "id": "77816de2-39c3-436c-b891-54d31f580961",
        ...
        "failure_domain_id": "<UUID>",
    }
  • 使用 API 設定 Edge 叢集,以根據失敗網域配置節點。先呼叫 GET /api/v1/edge-clusters/<edge-cluster-id> API 以取得有關 Edge 叢集的資料。使用 GET API 的結果作為 PUT /api/v1/edge-clusters/<edge-cluster-id> API 的輸入,並適當地設定其他內容 allocation_rules。例如,
    GET /api/v1/edge-clusters/<edge-cluster-id>
    Response:
    {
        "_revision": 0,
        "id": "bf8d4daf-93f6-4c23-af38-63f6d372e14e",
        "resource_type": "EdgeCluster",
        ...
    }
    
    PUT /api/v1/edge-clusters/<edge-cluster-id>
    {
        "_revision": 0,
        "id": "bf8d4daf-93f6-4c23-af38-63f6d372e14e",
        "resource_type": "EdgeCluster",
        ...
        "allocation_rules": [
            {
                "action": {
                          "enabled": true,
                          "action_type": "AllocationBasedOnFailureDomain"
                          }
            }
        ],
    }
  • 使用 API 或 NSX Manager UI 建立第 0 層和第 1 層閘道。

如果整個主要站台失敗,則次要站台中的第 0 層待命和第 1 層待命會自動接管並成為新的作用中閘道。如果主要站台中的其中一個 Edge 節點失敗,則會套用相同的原則。例如,在下圖中,假設 Edge 節點 1B 主控 Tier-0-Test 和 Tier-1-Test,Edge 節點 2A 主控 Tier-0-Test 待命,以及 Edge 節點 2B 主控 Tier-1-Test 待命。如果 Edge 節點 1B 失敗,則在 Edge 節點 2B 上的待命 Tier-0-Test 和 Edge 節點 2A 上的待命 Tier-1-Test 會接管並成為新的作用中閘道。

下圖說明資料平面的自動復原。

災難之前:

資料平面的自動復原 - 在進行災難復原前

災難復原之後:

資料平面的自動復原 - 在進行災難復原後

管理平面的手動/指令碼式復原

需求:
  • NSX Manager 的 DNS 具有短 TTL (例如,5 分鐘)。
  • 持續備份。

不需要 vSphere HA 和延伸的管理 VLAN。NSX-T Manager 必須與具有短 TTL 的 DNS 名稱相關聯。所有傳輸節點 (Edge 節點和 Hypervisor) 必須使用其 DNS 名稱連線至 NSX Manager。若要節省時間,您可以選擇性地在次要站台中預先安裝 NSX Manager 叢集。

復原步驟如下:
  1. 變更 DNS 記錄,讓 NSX Manager 叢集具有不同的 IP 位址。
  2. 從備份還原 NSX Manager 叢集。
  3. 讓傳輸節點連線至新的 NSX Manager 叢集。

下圖說明管理平面的手動/指令碼式復原。

管理平面的手動復原

資料平面的手動/指令碼式復原

需求:
  • Edge 節點之間的最大延遲時間為 150 毫秒。

Edge 節點可以是虛擬機器或裸機。第 0 層閘道可以是主動-待命或雙主動。Edge 節點虛擬機器可以安裝在不同的 vCenter Server 中。不需要 vSphere HA。

復原步驟如下:
  1. 在災害復原 (DR) 站台中的現有 Edge 叢集上建立待命第 0 層閘道。
  2. 使用 API,將連線至第 0 層閘道的第 1 層閘道移至 DR 站台中的第 0 層閘道。
  3. 使用 API 將獨立的第 1 層閘道移至 DR 站台。
  4. 使用 API 將第 2 層橋接器移至 DR 站台。

下圖說明資料平面的手動/指令碼式復原。

資料平面的手動復原

多站台部署需求

站台間通訊
  • 頻寬必須至少有 1 Gbps,且延遲時間 (RTT) 必須少於 150 毫秒。
  • MTU 必須至少為 1600。建議使用 9000。
NSX Manager 組態
  • 必須啟用在 NSX-T Data Center 組態有所變更時自動備份的功能。
  • NSX Manager 必須設為使用 FQDN。
數據平面復原
  • 如果公用 IP 位址是透過 NAT 或負載平衡器之類的服務公開,則必須使用相同的網際網路提供者。
  • 第 0 層閘道的 HA 模式必須為主動-待命模式,且容錯移轉模式必須為先佔式。
雲端管理系統
  • 雲端管理系統 (CMS) 必須支援 NSX-T Data Center 外掛程式。在此版本中,VMware Integrated OpenStack (VIO) 和 vRealize Automation (vRA) 可滿足此需求。

限制

  • 無本機出口功能。所有南北向流量均必須在一個站台內進行。
  • 計算災害復原軟體必須支援 NSX-T Data Center,例如 VMware SRM 8.1.2 或更新版本。