vSAN 클러스터 수동 종료 및 다시 시작

유지 보수 또는 문제 해결을 수행하기 위해 전체 vSAN 클러스터를 수동으로 종료할 수 있습니다.

워크플로에 수동 종료가 필요한 경우가 아니면 클러스터 종료 마법사를 사용합니다. vSAN 클러스터를 수동으로 종료할 때 클러스터에서 vSAN을 사용하지 않도록 설정하지 마십시오.

참고: vSphere with Tanzu 환경이 있는 경우 구성 요소를 종료하거나 시작할 때 지정된 순서를 따라야 합니다. 자세한 내용은 " VMware 검증된 설계 설명서" 의 "vSphere with Tanzu 워크로드 도메인 종료"를 참조하십시오.

프로시저

vSAN 클러스터를 종료합니다.
1. vSAN 상태 서비스를 확인하여 클러스터가 정상인지 알아봅니다.
2. vCenter Server가 클러스터에서 호스팅되지 않으면 vSAN 클러스터에서 실행 중인 모든 VM(가상 시스템)의 전원을 끕니다. vCenter Server가 vSAN 클러스터에서 호스팅되는 경우 vCenter Server VM의 전원을 끄지 마십시오.
3. 구성 탭을 클릭하고 HA를 해제합니다. 그 결과 클러스터가 호스트 종료를 실패로 등록하지 않습니다.
  
  vSphere 7.0 U1 이상에서는 vCLS 재처리 모드를 사용하도록 설정합니다. 자세한 내용은 https://kb.vmware.com/s/article/80472에서 VMware 기술 자료 문서를 참조하십시오.
4. 모든 재동기화 작업이 완료되었는지 확인합니다.
  모니터 탭을 클릭하고 vSAN > 개체 다시 동기화를 선택합니다.
5. vCenter Server가 vSAN 클러스터에서 호스팅되는 경우 vCenter Server VM의 전원을 끕니다.
  vCenter Server VM을 실행하는 호스트를 기록해 둡니다. vCenter Server VM을 다시 시작해야 하는 호스트입니다.
6. 클러스터의 ESXi 호스트에서 다음 명령을 실행하여 vCenter Server에서 클러스터 멤버 업데이트를 사용하지 않도록 설정합니다. 모든 호스트에서 다음 명령을 실행해야 합니다.
```
esxcfg-advcfg -s 1 /VSAN/IgnoreClusterMemberListUpdates
```
7. 감시 호스트 이외의 클러스터에 있는 호스트에 로그인합니다.
8. 해당 호스트에서만 다음 명령을 실행합니다. 여러 호스트에서 이 명령을 동시에 실행하는 경우 경합 조건으로 인해 예기치 않은 결과가 발생할 수 있습니다.
```
python /usr/lib/vmware/vsan/bin/reboot_helper.py prepare
```
  이 명령은 다음을 반환하고 출력합니다.
  클러스터 준비가 완료되었습니다.
  참고:
  - 명령이 성공적으로 완료된 후 클러스터가 완전히 분할됩니다.
  - 오류가 발생하면 오류 메시지에 따라 문제를 해결하고 vCLS 재처리 모드를 다시 사용하도록 설정하십시오.
  - 클러스터에 비정상 또는 연결이 끊긴 호스트가 있는 경우 해당 호스트를 제거하고 명령을 다시 시도하십시오.
9. 모든 호스트를 작업 없음의 유지 보수 모드로 전환합니다. vCenter Server의 전원이 꺼져 있으면 다음 명령을 사용하여 ESXi 호스트를 작업 없음의 유지 보수 모드로 전환하십시오.
```
esxcli system maintenanceMode set -e true -m noAction
```
  모든 호스트에서 이 단계를 수행합니다.
  
  여러 호스트에서 작업 없음을 사용하고 여러 호스트를 재부팅하면서 데이터를 사용할 수 없게 되는 상황을 피하려면 VMware 기술 자료 문서( https://kb.vmware.com/s/article/60424)를 참조하십시오. 기본 제공 도구를 사용하여 클러스터의 모든 호스트를 동시에 재부팅하려면 VMware 기술 자료 문서( https://kb.vmware.com/s/article/70650)를 참조하십시오.
10. 모든 호스트가 유지 보수 모드로 전환되면 필요한 모든 유지 보수 작업을 수행하고 호스트의 전원을 끕니다.
vSAN 클러스터를 다시 시작합니다.
1. ESXi 호스트의 전원을 켭니다.
  ESXi가 설치된 물리적 상자의 전원을 켭니다. ESXi 호스트가 시작되고 해당 VM을 찾은 후 정상적으로 작동합니다.
  
  호스트가 다시 시작되지 않으면 수동으로 호스트를 복구하거나 잘못된 호스트를 vSAN 클러스터 외부로 이동해야 합니다.
2. 전원을 켠 후 모든 호스트가 백업되면 모든 호스트의 유지 보수 모드를 종료합니다. vCenter Server의 전원이 꺼지면 ESXi 호스트에서 다음 명령을 사용하여 유지 보수 모드를 종료합니다.
```
esxcli system maintenanceMode set -e false
```
  모든 호스트에서 이 단계를 수행합니다.
3. 감시 호스트 이외의 클러스터에 있는 호스트 중 하나에 로그인합니다.
4. 해당 호스트에서만 다음 명령을 실행합니다. 여러 호스트에서 이 명령을 동시에 실행하는 경우 경합 조건으로 인해 예기치 않은 결과가 발생할 수 있습니다.
```
python /usr/lib/vmware/vsan/bin/reboot_helper.py recover
```
  이 명령은 다음을 반환하고 출력합니다.
  클러스터 재부팅/전원 켜기가 완료되었습니다.
5. 각 호스트에서 다음 명령을 실행하여 클러스터에서 모든 호스트를 사용할 수 있는지 확인합니다.
```
esxcli vsan cluster get
```
6. 클러스터의 ESXi 호스트에서 다음 명령을 실행하여 vCenter Server에서 클러스터 멤버 업데이트를 사용하도록 설정합니다. 모든 호스트에서 다음 명령을 실행해야 합니다.
```
esxcfg-advcfg -s 0 /VSAN/IgnoreClusterMemberListUpdates
```
7. 전원이 꺼진 경우 vCenter Server VM을 다시 시작합니다. vCenter Server VM의 전원이 켜지고 실행될 때까지 기다립니다. vCLS 재처리 모드를 사용하지 않도록 설정하려면 https://kb.vmware.com/s/article/80472에서 VMware 기술 지원 문서를 참조하십시오.
8. 각 호스트에서 다음 명령을 실행하여 모든 호스트가 vSAN 클러스터에 참여하고 있는지를 다시 확인합니다.
```
esxcli vsan cluster get
```
9. vCenter Server를 통해 나머지 VM을 다시 시작합니다.
10. vSAN 상태 서비스를 확인하고 남아 있는 문제를 해결합니다.
11. (선택 사항) vSAN 클러스터에서 vSphere 가용성을 사용하도록 설정한 경우 vSphere 가용성을 수동으로 다시 시작하여 vSphere HA 마스터 에이전트를 찾을 수 없습니다. 오류가 표시되지 않도록 해야 합니다.
  vSphere 가용성을 수동으로 다시 시작하려면 vSAN 클러스터를 선택하고 다음으로 이동합니다.
  1. 구성 > 서비스 > vSphere 가용성 > 편집 > vSphere HA 사용 안 함
  2. 구성 > 서비스 > vSphere 가용성 > 편집 > vSphere HA 사용
클러스터에 비정상이거나 연결이 끊긴 호스트가 있는 경우 vSAN 클러스터에서 호스트를 복구하거나 제거합니다. vSAN 상태 서비스가 사용 가능한 모든 호스트를 녹색 상태로 표시한 후에만 위 명령을 다시 시도하십시오.
3노드 vSAN 클러스터가 있는 경우 단일 호스트 장애 상황에서는 reboot_helper.py recover 명령이 작동할 수 없습니다. 관리자는 다음을 수행합니다.
1. 유니캐스트 에이전트 목록에서 실패 호스트 정보를 일시적으로 제거합니다.
2. 다음 명령을 실행하여 호스트를 추가합니다.
```
reboot_helper.py recover
```
다음은 vSAN 클러스터에서 호스트를 제거 및 추가하는 명령입니다.
```
#esxcli vsan cluster unicastagent remove -a <IP Address> -t node -u <NodeUuid>
```
```
#esxcli vsan cluster unicastagent add -t node -u <NodeUuid> -U true -a <IP Address> -p 12321
```