NSX-T Data Center 多站台

NSX-T Data Center 支援多站台部署，進而您可從一個 NSX Manager 叢集管理所有站台。

支援兩種類型的多站台部署：

災難復原
作用中/作用中

下圖說明災難復原部署。

在作用中/作用中部署中，所有站台均處於作用中狀態，且第 2 層流量會跨越站台界限。在災難復原部署中，位於主要站台的 NSX-T Data Center 會處理企業的網路。次要站台則會處於備用狀態，以便在主要站台發生災難性失敗時接手。

下圖說明作用中/作用中部署。

您可以為管理平面和數據平面部署自動或手動/指令碼式復原的兩個站台。

管理平面的自動復原

需求：

在設定的站台間具有 HA 的延伸 vCenter 叢集。
延伸的管理 VLAN。

NSX Manager 叢集會部署在管理 VLAN 上，並且實際位於主要站台中。如果主要站台故障，vSphere HA 將會重新啟動次要站台中的 NSX Manager。所有傳輸節點會自動重新連線至重新啟動的 NSX Manager。此程序需要大約 10 分鐘。在此期間，管理平面無法使用，但數據平面不會受到影響。

下圖說明管理平面的自動復原。

災難之前：

管理平面的自動復原 - 在進行災難復原前

災難復原之後：

管理平面的自動復原 - 在進行災難復原後

數據平面的自動復原

您可以為 Edge 節點設定失敗網域，以實現數據平面的自動復原。您可以將 Edge 叢集內的 Edge 節點分組在不同的失敗網域中。NSX Manager 會自動將任何新的作用中第 1 層閘道置於慣用的失敗網域，以及將待命第 1 層閘道置於另一個網域。

需求：

Edge 節點之間的最大延遲時間為 10 毫秒。
第 0 層閘道的 HA 模式必須為作用中/待命模式，且容錯移轉模式必須為先佔式。
如果可以進行非對稱路由 (例如，兩個位置是兩棟建築物，它們之間沒有任何實體防火牆)，則第 0 層閘道的 HA 模式可以是作用中/作用中。

附註：第 1 層閘道的容錯移轉模式可以是先佔式和非先佔式，但建議設定為先佔式，以確保第 0 層和第 1 層閘道位於同一位置。

組態步驟：

使用 API 建立兩個站台的失敗網域，例如 FD1A-Preferred_Site1 和 FD2A-Preferred_Site1。將參數 preferred_active_edge_services 設定為主要站台的 true，並將其設定為次要站台的 false。

POST /api/v1/failure-domains
{
"display_name": "FD1A-Preferred_Site1",
"preferred_active_edge_services": "true"
}

POST /api/v1/failure-domains
{
"display_name": "FD2A-Preferred_Site1",
"preferred_active_edge_services": "false"
}

使用 API，設定延伸到兩個站台的 Edge 叢集。例如，叢集在主要站台中有 Edge 節點 EdgeNode1A 和 EdgeNode1B，而在次要站台中有 Edge 節點 EdgeNode2A 和 EdgeNode2B。作用中的第 0 層和第 1 層閘道將在 EdgeNode1A 和 EdgeNode1B 上執行。待命第 0 層和第 1 層閘道將在 EdgeNode2A 和 EdgeNode2B 上執行。

使用 API，將每個 Edge 節點與該站台的失敗網域建立關聯。先呼叫 GET /api/v1/transport-nodes/<transport-node-id> API 以取得有關 Edge 節點的資料。使用 GET API 的結果作為 PUT /api/v1/transport-nodes/<transport-node-id> API 的輸入，並適當地設定其他內容 failure_domain_id。例如，

GET /api/v1/transport-nodes/<transport-node-id>
Response:
{
    "resource_type": "TransportNode",
    "description": "Updated NSX configured Test Transport Node",
    "id": "77816de2-39c3-436c-b891-54d31f580961",
    ...
}

PUT /api/v1/transport-nodes/<transport-node-id>
{
    "resource_type": "TransportNode",
    "description": "Updated NSX configured Test Transport Node",
    "id": "77816de2-39c3-436c-b891-54d31f580961",
    ...
    "failure_domain_id": "<UUID>",
}

使用 API 設定 Edge 叢集，以根據失敗網域配置節點。先呼叫 GET /api/v1/edge-clusters/<edge-cluster-id> API 以取得有關 Edge 叢集的資料。使用 GET API 的結果作為 PUT /api/v1/edge-clusters/<edge-cluster-id> API 的輸入，並適當地設定其他內容 allocation_rules。例如，

GET /api/v1/edge-clusters/<edge-cluster-id>
Response:
{
    "_revision": 0,
    "id": "bf8d4daf-93f6-4c23-af38-63f6d372e14e",
    "resource_type": "EdgeCluster",
    ...
}

PUT /api/v1/edge-clusters/<edge-cluster-id>
{
    "_revision": 0,
    "id": "bf8d4daf-93f6-4c23-af38-63f6d372e14e",
    "resource_type": "EdgeCluster",
    ...
    "allocation_rules": [
        {
            "action": {
                      "enabled": true,
                      "action_type": "AllocationBasedOnFailureDomain"
                      }
        }
    ],
}

使用 API 或 NSX Manager UI 建立第 0 層和第 1 層閘道。

如果整個主要站台失敗，則次要站台中的第 0 層待命和第 1 層待命會自動接管並成為新的作用中閘道。如果主要站台中的其中一個 Edge 節點失敗，則會套用相同的原則。例如，在下圖中，假設 Edge 節點 1B 主控 Tier-0-Test 和 Tier-1-Test，Edge 節點 2A 主控 Tier-0-Test 待命，以及 Edge 節點 2B 主控 Tier-1-Test 待命。如果 Edge 節點 1B 失敗，則在 Edge 節點 2B 上的待命 Tier-0-Test 和 Edge 節點 2A 上的待命 Tier-1-Test 會接管並成為新的作用中閘道。

下圖說明數據平面的自動復原。

災難之前：

數據平面的自動復原 - 在進行災難復原前

災難復原之後：

數據平面的自動復原 - 在進行災難復原後

管理平面的手動/指令碼式復原

需求：

NSX Manager 的 DNS 具有短 TTL (例如，5 分鐘)。
持續備份。

不需要 vSphere HA 和延伸的管理 VLAN。NSX-T Manager 必須與具有短 TTL 的 DNS 名稱相關聯。所有傳輸節點 (Edge 節點和 Hypervisor) 必須使用其 DNS 名稱連線至 NSX Manager。若要節省時間，您可以選擇性地在次要站台中預先安裝 NSX Manager 叢集。

復原步驟如下：

變更 DNS 記錄，讓 NSX Manager 叢集具有不同的 IP 位址。
從備份還原 NSX Manager 叢集。
讓傳輸節點連線至新的 NSX Manager 叢集。

下圖說明管理平面的手動/指令碼式復原。

管理平面的手動復原

數據平面的手動/指令碼式復原

需求：

Edge 節點之間的最大延遲時間為 150 毫秒。

Edge 節點可以是虛擬機器或裸機。每個位置中的第 0 層閘道可以是作用中/待命或作用中/作用中。Edge 節點虛擬機器可以安裝在不同的 vCenter Server 中。不需要 vSphere HA。

復原步驟如下：

使用 API 將連接至主要第 0 層閘道的第 1 層閘道 (下圖中藍色部分) 移至次要第 0 層閘道 (綠色)。
使用 API 將獨立的第 1 層閘道移至次要站台。
使用 API 將第 2 層橋接器移至次要站台。

下圖說明數據平面的手動/指令碼式復原。

數據平面的手動復原

多站台部署需求

站台間通訊

頻寬必須至少有 1 Gbps，且延遲時間 (RTT) 必須少於 150 毫秒。
MTU 必須至少為 1600。建議使用 9000。

NSX Manager

對於管理平面自動復原
- 在站台之間延伸 VLAN 管理。
- vSphere HA 跨 NSX Manager 虛擬機器站台。
對於管理平面的手動/指令碼式復原
- 持續備份。
- NSX Manager 必須設為使用 FQDN。

數據平面

如果公用 IP 位址是透過 NAT 或負載平衡器之類的服務公開，則必須使用相同的網際網路提供者。
對於管理平面自動復原
- 位置之間的最大延遲為 10 毫秒。
- 第 0 層閘道的 HA 模式必須為作用中/待命，且容錯移轉模式必須為先佔式，以確保沒有非對稱路由。
- 如果可接受非對稱路由 (例如，都會區域中的不同建築物)，則第 0 層閘道的 HA 模式可以是作用中/作用中。
對於管理平面的手動/指令碼式復原
- 位置之間的最大延遲為 150 毫秒。

雲端管理系統

雲端管理系統 (CMS) 必須支援 NSX-T Data Center 外掛程式。在此版本中，VMware Integrated OpenStack (VIO) 和 vRealize Automation (vRA) 可滿足此需求。

限制

無本機出口功能。所有南北向流量均必須在一個站台內進行。
計算災難復原軟體必須支援 NSX-T Data Center，例如 VMware SRM 8.1.2 或更新版本。