구성 2: 여러 vmknic, 기존 포트 ID 기준 라우팅

논리적 및 물리적으로 분리된 두 라우팅 불가능 VLAN을 사용하여 에어갭 토폴로지를 생성할 수 있습니다.

이 예에서는 vSphere Distributed Switch에 대한 구성 단계를 제공하지만 vSphere Standard Switch를 사용할 수도 있습니다. 2개의 10Gb의 물리적 NIC를 사용하고 이러한 NIC를 vSphere 네트워킹 계층에서 논리적으로 분리합니다.

각 vSAN VMkernel vmknic에 대해 두 개의 분산 포트 그룹을 생성합니다. 각 포트 그룹에는 별도의 VLAN 태그가 있습니다. vSAN VMkernel 구성의 경우 vSAN 트래픽에는 두 VLAN의 두 IP 주소가 필요합니다.

참고:

실제 구현에서는 완전 이중화를 위해 일반적으로 4개의 물리적 업링크를 사용합니다.

각 포트 그룹에 대해 팀 구성 및 페일오버 정책이 기본 설정을 사용합니다.

로드 밸런싱을 기존 포트 ID 기준 라우팅으로 설정합니다.
네트워크 장애 감지를 링크 상태만으로 설정합니다.
스위치 알림을 기본값인 예로 설정합니다.
페일백을 기본값인 예로 설정합니다.
업링크 구성에는 활성 위치의 업링크 1개와 미사용 위치의 업링크 1개가 있습니다.

한 네트워크가 다른 네트워크와 완전히 분리됩니다.

vSAN 포트 그룹 1

이 예에서는 vSAN-DPortGroup-1이라는 분산 포트 그룹을 사용합니다. 다음 팀 구성 및 페일오버 정책을 사용할 경우 이 포트 그룹에 VLAN 3266이 태그로 지정됩니다.

VLAN 3266으로 태그가 지정된 포트 그룹의 트래픽
로드 밸런싱을 기존 포트 ID 기준 라우팅으로 설정합니다.
네트워크 장애 감지를 링크 상태만으로 설정합니다.
스위치 알림을 기본값인 예로 설정합니다.
페일백을 기본값인 예로 설정합니다.
업링크 구성에는 활성 위치의 업링크 1과 미사용 위치의 업링크 2가 있습니다.

vSAN 포트 그룹 2

vSAN 포트 그룹 1을 보완하려면 다음과 같은 차이점을 적용하여 vSAN-portgroup-2라는 두 번째 분산 포트 그룹을 구성합니다..

VLAN 3265으로 태그가 지정된 포트 그룹의 트래픽
업링크 구성에는 활성 위치의 업링크 2와 미사용 " " 위치의 업링크 1가 있습니다.

vSAN VMkernel 포트 구성

2개의 vSAN VMkernel 인터페이스를 두 포트 그룹 모두에서 생성합니다. 이 예에서 포트 그룹의 이름은 vmk1 및 vmk2입니다.

vmk1은 VLAN 3266(172.40.0.xx)과 연결되며, 결과 포트 그룹 vSAN-DPortGroup-1로 지정됩니다.
vmk2는 VLAN 3265(192.60.0.xx)과 연결되며, 결과 포트 그룹 vSAN-DPortGroup-2로 지정됩니다.

로드 밸런싱

vSAN에는 여러 vmknic를 구분하는 로드 밸런싱 메커니즘이 없으므로 선택한 vSAN I/O 경로가 물리적 NIC에서 확정적이지 않습니다. vSphere 성능 차트는 하나의 물리적 NIC가 다른 NIC보다 더 많이 사용되는 것을 보여 줍니다. 4개 호스트의 전체 플래시 vSAN 클러스터에서 64K 블록 크기를 사용하며 읽기/쓰기 비율이 70:30인 120개 VM으로 랩에서 수행되는 간단한 I/O 테스트에 따르면 NIC 간의 불균형 로드가 확인되었습니다.

vSphere 성능 그래프는 NIC 간의 불균형 로드를 표시합니다.

네트워크 업링크 이중화가 손실됨

이 구성에 도입된 네트워크 장애를 고려하십시오. vmnic1이 지정된 vSAN 호스트에서 사용되지 않도록 설정되었습니다. 결과적으로 포트 vmk2가 영향을 받습니다. 실패한 NIC는 네트워크 연결 경보 및 이중화 경보를 둘 다 트리거합니다.

vSAN의 경우 이 페일오버 프로세스는 CMMDS(클러스터 모니터링, 멤버 자격 및 디렉토리 서비스)가 실패를 감지하고 약 10초 후에 트리거됩니다. 페일오버 및 복구 시 vSAN은 장애가 발생한 네트워크에서 모든 활성 연결을 중지하고 작동하는 나머지 네트워크에서 연결을 다시 설정하려고 시도합니다.

분리된 VLAN에서 두 개의 별도 vSAN VMkernel 포트가 통신하기 때문에 vSAN 상태 점검 실패가 트리거될 수 있습니다. vmk2가 더는 VLAN 3265에서 해당 피어와 통신할 수 없기 때문에 이러한 동작이 예상됩니다.

성능 차트는 vmnic1의 장애로 인해 영향을 받은 워크로드가 vmnic0에서 다시 시작되었음을 보여 줍니다(이 테스트를 위해 사용하지 않도록 설정됨). 이 테스트에서는 vSphere NIC 팀 구성과 이 토폴로지 간의 중요한 차이점을 보여 줍니다. vSAN은 나머지 네트워크에서 연결을 다시 설정하거나 다시 시작하려고 합니다.

그러나 일부 실패 시나리오에서 영향을 받은 연결 복구를 완료하려면 ESXi TCP 연결 시간 초과로 인해 최대 90초가 필요할 수 있습니다. 후속 연결 시도는 실패할 수 있지만 연결 시도는 5초 후에 시간 초과하고 가능한 모든 IP 주소를 순환합니다. 이 동작은 가상 시스템 게스트 I/O에 영향을 줄 수 있습니다. 따라서 애플리케이션 및 가상 시스템 I/O를 다시 시도해야 할 수 있습니다.

예를 들어 Windows Server 2012 VM에서 페일오버 및 복구 프로세스 중에 이벤트 ID 153(디바이스 재설정) 및 129(재시도 이벤트)가 기록될 수 있습니다. 이 예에서 이벤트 ID 129는 I/O가 복구될 때까지 약 90초 동안 로깅되었습니다.

일부 게스트 운영 체제의 디스크 시간 초과 설정을 수정하여 심각하게 영향을 받지 않도록 해야 할 수 있습니다. 디스크 시간 초과 값은 VMware Tools가 있는지와 특정 게스트 운영 체제 유형 및 버전에 따라 다를 수 있습니다. 게스트 운영 체제 디스크 시간 초과 값 변경에 대한 자세한 내용은 VMware KB 1009465로 이동하십시오.

복구 및 페일백

네트워크가 복구되면 다른 오류로 인해 워크로드가 강제로 발생하는 경우가 아니면 워크로드가 자동으로 재조정되지 않습니다. 영향을 받는 네트워크가 복구되는 즉시, 새 TCP 연결에 사용할 수 있게 됩니다.