유지 보수 또는 문제 해결을 수행하기 위해 전체 vSAN 클러스터를 수동으로 종료할 수 있습니다.
워크플로에 수동 종료가 필요한 경우가 아니면 클러스터 종료 마법사를 사용합니다. vSAN 클러스터를 수동으로 종료할 때 클러스터에서 vSAN을 사용하지 않도록 설정하지 마십시오.
참고: vSphere with Tanzu 환경이 있는 경우 구성 요소를 종료하거나 시작할 때 지정된 순서를 따라야 합니다. 자세한 내용은 "
VMware 검증된 설계 설명서" 의 "vSphere with Tanzu 워크로드 도메인 종료"를 참조하십시오.
프로시저
- vSAN 클러스터를 종료합니다.
- vSAN 상태 서비스를 확인하여 클러스터가 정상인지 알아봅니다.
- vCenter Server가 클러스터에서 호스팅되지 않으면 vSAN 클러스터에서 실행 중인 모든 VM(가상 시스템)의 전원을 끕니다. vCenter Server가 vSAN 클러스터에서 호스팅되는 경우 vCenter Server VM의 전원을 끄지 마십시오.
- 구성 탭을 클릭하고 HA를 해제합니다. 그 결과 클러스터가 호스트 종료를 실패로 등록하지 않습니다.
vSphere 7.0 U1 이상에서는 vCLS 재처리 모드를 사용하도록 설정합니다. 자세한 내용은 https://kb.vmware.com/s/article/80472에서 VMware 기술 자료 문서를 참조하십시오.
- 모든 재동기화 작업이 완료되었는지 확인합니다.
모니터 탭을 클릭하고 vSAN > 개체 다시 동기화를 선택합니다.
- vCenter Server가 vSAN 클러스터에서 호스팅되는 경우 vCenter Server VM의 전원을 끕니다.
vCenter Server VM을 실행하는 호스트를 기록해 둡니다. vCenter Server VM을 다시 시작해야 하는 호스트입니다.
- 클러스터의 ESXi 호스트에서 다음 명령을 실행하여 vCenter Server에서 클러스터 멤버 업데이트를 사용하지 않도록 설정합니다. 모든 호스트에서 다음 명령을 실행해야 합니다.
esxcfg-advcfg -s 1 /VSAN/IgnoreClusterMemberListUpdates
- 감시 호스트 이외의 클러스터에 있는 호스트에 로그인합니다.
- 해당 호스트에서만 다음 명령을 실행합니다. 여러 호스트에서 이 명령을 동시에 실행하는 경우 경합 조건으로 인해 예기치 않은 결과가 발생할 수 있습니다.
python /usr/lib/vmware/vsan/bin/reboot_helper.py prepare
이 명령은 다음을 반환하고 출력합니다.
클러스터 준비가 완료되었습니다.참고:- 명령이 성공적으로 완료된 후 클러스터가 완전히 분할됩니다.
- 오류가 발생하면 오류 메시지에 따라 문제를 해결하고 vCLS 재처리 모드를 다시 사용하도록 설정하십시오.
- 클러스터에 비정상 또는 연결이 끊긴 호스트가 있는 경우 해당 호스트를 제거하고 명령을 다시 시도하십시오.
- 모든 호스트를 작업 없음의 유지 보수 모드로 전환합니다. vCenter Server의 전원이 꺼져 있으면 다음 명령을 사용하여 ESXi 호스트를 작업 없음의 유지 보수 모드로 전환하십시오.
esxcli system maintenanceMode set -e true -m noAction
모든 호스트에서 이 단계를 수행합니다.여러 호스트에서 작업 없음을 사용하고 여러 호스트를 재부팅하면서 데이터를 사용할 수 없게 되는 상황을 피하려면 VMware 기술 자료 문서( https://kb.vmware.com/s/article/60424)를 참조하십시오. 기본 제공 도구를 사용하여 클러스터의 모든 호스트를 동시에 재부팅하려면 VMware 기술 자료 문서( https://kb.vmware.com/s/article/70650)를 참조하십시오. - 모든 호스트가 유지 보수 모드로 전환되면 필요한 모든 유지 보수 작업을 수행하고 호스트의 전원을 끕니다.
- vSAN 클러스터를 다시 시작합니다.
- ESXi 호스트의 전원을 켭니다.
ESXi가 설치된 물리적 상자의 전원을 켭니다. ESXi 호스트가 시작되고 해당 VM을 찾은 후 정상적으로 작동합니다.호스트가 다시 시작되지 않으면 수동으로 호스트를 복구하거나 잘못된 호스트를 vSAN 클러스터 외부로 이동해야 합니다.
- 전원을 켠 후 모든 호스트가 백업되면 모든 호스트의 유지 보수 모드를 종료합니다. vCenter Server의 전원이 꺼지면 ESXi 호스트에서 다음 명령을 사용하여 유지 보수 모드를 종료합니다.
esxcli system maintenanceMode set -e false
모든 호스트에서 이 단계를 수행합니다. - 감시 호스트 이외의 클러스터에 있는 호스트 중 하나에 로그인합니다.
- 해당 호스트에서만 다음 명령을 실행합니다. 여러 호스트에서 이 명령을 동시에 실행하는 경우 경합 조건으로 인해 예기치 않은 결과가 발생할 수 있습니다.
python /usr/lib/vmware/vsan/bin/reboot_helper.py recover
이 명령은 다음을 반환하고 출력합니다.
클러스터 재부팅/전원 켜기가 완료되었습니다. - 각 호스트에서 다음 명령을 실행하여 클러스터에서 모든 호스트를 사용할 수 있는지 확인합니다.
esxcli vsan cluster get
- 클러스터의 ESXi 호스트에서 다음 명령을 실행하여 vCenter Server에서 클러스터 멤버 업데이트를 사용하도록 설정합니다. 모든 호스트에서 다음 명령을 실행해야 합니다.
esxcfg-advcfg -s 0 /VSAN/IgnoreClusterMemberListUpdates
- 전원이 꺼진 경우 vCenter Server VM을 다시 시작합니다. vCenter Server VM의 전원이 켜지고 실행될 때까지 기다립니다. vCLS 재처리 모드를 사용하지 않도록 설정하려면 https://kb.vmware.com/s/article/80472에서 VMware 기술 지원 문서를 참조하십시오.
- 각 호스트에서 다음 명령을 실행하여 모든 호스트가 vSAN 클러스터에 참여하고 있는지를 다시 확인합니다.
esxcli vsan cluster get
- vCenter Server를 통해 나머지 VM을 다시 시작합니다.
- vSAN 상태 서비스를 확인하고 남아 있는 문제를 해결합니다.
- (선택 사항) vSAN 클러스터에서 vSphere 가용성을 사용하도록 설정한 경우 vSphere 가용성을 수동으로 다시 시작하여 vSphere HA 마스터 에이전트를 찾을 수 없습니다. 오류가 표시되지 않도록 해야 합니다.
vSphere 가용성을 수동으로 다시 시작하려면 vSAN 클러스터를 선택하고 다음으로 이동합니다.
- 구성 > 서비스 > vSphere 가용성 > 편집 > vSphere HA 사용 안 함
- 구성 > 서비스 > vSphere 가용성 > 편집 > vSphere HA 사용
- ESXi 호스트의 전원을 켭니다.
- 클러스터에 비정상이거나 연결이 끊긴 호스트가 있는 경우 vSAN 클러스터에서 호스트를 복구하거나 제거합니다. vSAN 상태 서비스가 사용 가능한 모든 호스트를 녹색 상태로 표시한 후에만 위 명령을 다시 시도하십시오.
3노드 vSAN 클러스터가 있는 경우 단일 호스트 장애 상황에서는 reboot_helper.py recover 명령이 작동할 수 없습니다. 관리자는 다음을 수행합니다.
- 유니캐스트 에이전트 목록에서 실패 호스트 정보를 일시적으로 제거합니다.
- 다음 명령을 실행하여 호스트를 추가합니다.
reboot_helper.py recover
다음은 vSAN 클러스터에서 호스트를 제거 및 추가하는 명령입니다.#esxcli vsan cluster unicastagent remove -a <IP Address> -t node -u <NodeUuid>
#esxcli vsan cluster unicastagent add -t node -u <NodeUuid> -U true -a <IP Address> -p 12321