VMware Aria Operations에서는 CA(지속적인 가용성)를 지원합니다. CA에서는 VMware Aria Operations 클러스터를 장애 도메인 2개로 분리하여 vSphere 클러스터들에 걸쳐 확장하고, 전체 장애 도메인의 손실에 대비하여 분석 클러스터를 보호합니다.
지속적인 가용성을 사용하여 분석 클러스터를 구성할 수 있습니다. 이를 통해 클러스터 노드가 두 개의 장애 도메인에 걸쳐 확장될 수 있습니다. 장애 도메인은 데이터 센터의 물리적 위치에 따라 그룹화된 하나 이상의 분석 노드로 구성됩니다. CA를 사용하는 경우 VMware Aria Operations에서 장애 도메인 두 개를 사용하여 전체 물리적 위치의 장애 및 단일 장애 도메인 전용 리소스에서 발생하는 장애를 허용할 수 있습니다.
VMware Aria Operations에서 지속적인 가용성을 활성화하려면 클러스터에 감시 노드를 배포해야 합니다. VMware Aria Operations 클러스터에는 감시 노드가 하나만 있을 수 있습니다. 감시 노드에서는 데이터를 수집하거나 저장하지 않습니다. 네트워크 연결이 두 개의 장애 도메인을 손실하는 상황에서 클러스터는 분할 두뇌 상황으로 이동합니다. 이 상황은 감시 노드에 의해 감지되며 장애 도메인 중 하나는 오프라인으로 전환되어 데이터 불일치 문제가 발생하지 않습니다. 감시 노드에 의해 오프라인으로 설정된 노드의 관리 UI에 온라인으로 전환 버튼이 표시됩니다. 이 옵션을 사용하여 장애 도메인을 온라인으로 전환하기 전에 두 장애 도메인의 노드 간 네트워크 연결이 복원되고 안정적이어야 합니다. 확인되면 장애 도메인을 온라인으로 전환할 수 있습니다.
CA를 사용하면 장애 도메인 1에서 그룹화된 데이터 노드와 기본 노드에 저장된 데이터가 장애 도메인 2에서 쌍으로 연결된 데이터 노드와 복제본 노드로 항상 100% 동기화됩니다. CA를 활성화하려면 기본 노드 외에 하나 이상의 데이터 노드를 배포해야 합니다. 데이터 노드가 둘 이상 있는 경우에는 기본 노드를 포함하여 데이터 노드가 짝수로 있어야 합니다. 예를 들어 클러스터에는 적절한 크기 조정 요구 사항에 따라 노드가 2, 4, 6, 8, 10, 12, 14 또는 16개가 있어야 합니다. 장애 도메인 1의 기본 노드에 저장된 데이터는 장애 도메인 2의 복제 노드에 저장되고 복제됩니다. 장애 도메인 1의 데이터 노드에 저장 된 데이터는 장애 도메인 2의 쌍으로 연결된 데이터 노드에 저장되고 복제됩니다. 그러나 기본 노드에 장애가 발생하는 경우 복제 노드만 기본 노드 대신 작동할 수 있습니다.
- CA는 장애 도메인 하나에 특정한 분석 노드의 반이 손실되는 것에 대비하여 분석 클러스터를 보호합니다. 노드를 격리하거나 장애 영역을 구축하기 위해 vSphere 클러스터들에 걸쳐 노드를 확장할 수 있습니다.
- CA를 활성화하는 경우 기본 노드에 장애가 발생하는 경우에 기본 노드에서 제공하는 모든 기능을 복제본 노드에서 수행할 수 있습니다. 복제본으로의 페일오버는 자동으로 수행되며 단 2~3분의 VMware Aria Operations 다운타임 후에 작업이 재개되고 데이터 수집이 다시 시작됩니다.
참고: 기본 노드에 장애가 발생하는 경우 복제본 노드가 기본 노드가 되고 성능 저하 모드에서 클러스터가 실행됩니다. 이 문제를 해결하려면 다음 작업 중 하나를 수행합니다.
- 기본 노드 장애를 수동으로 수정합니다.
- 기본 노드를 교체하여 CA 모드로 돌아갑니다. 교체 노드에서 노드 장애를 복구하지 않고 대신 새 노드에서 기본 노드 역할을 수행합니다.
- 관리 인터페이스에서 CA 복제본 노드가 역할을 맡고 새 기본 노드가 되면 클러스터에서 이전의 오프라인 기본 노드를 제거할 수 없습니다. 또한 이전 노드가 계속해서 기본 노드로 나열됩니다. 표시를 새로 고치고 노드 제거를 활성화하려면 브라우저를 새로 고칩니다.
- CA를 활성화하면 클러스터는 모두 장애 도메인 하나에 있을 때 데이터 노드의 반이 손실되어도 데이터 손실 없이 유지될 수 있습니다. CA에서는 한 번에 하나의 장애 도메인 손실만 대비합니다. 데이터 및 기본/복제본 노드가 동시에 손실되거나 양쪽 장애 도메인에서 데이터 노드가 둘 이상 손실되는 경우는 지원되지 않습니다.
- 장애 도메인 중 하나가 중단된 상태에서 기본 노드 또는 기본 노드 복제본의 전원을 끄면 CA를 활성화한 클러스터가 작동하지 않습니다.
- CA를 활성화하면 CA에서 클러스터 전체 데이터의 중복 복사본과 기본 노드의 복제본 백업을 생성하므로 VMware Aria Operations 용량 및 처리 성능이 반으로 낮아집니다. VMware Aria Operations 클러스터 노드의 수 및 크기를 계획할 때 CA 사용 가능성을 고려하십시오. VMware Aria Operations 클러스터 크기 조정을(를) 참조하십시오.
- CA를 활성화할 때는 이중화 및 분리를 위해 개별 호스트에 각 장애 도메인의 분석 클러스터 노드를 배포합니다. vSphere 클러스터의 특정 호스트에 노드를 유지하는 반선호도 규칙을 사용할 수도 있습니다.
- 각 장애 도메인에 노드를 별도로 보관할 수 없는 경우에도 CA를 활성화할 수 있습니다. 호스트 장애가 발생하면 장애 도메인의 데이터 노드가 손실될 수 있으며, VMware Aria Operations는 다른 장애 도메인에서 계속 사용할 수 있습니다.
- 데이터 노드를 다른 vSphere 클러스터로 분할할 수 없는 경우 CA를 활성화하지 마십시오. 클러스터에 장애가 발생하면 데이터 노드가 둘 이상 손실될 수 있고, 이는 지원되지 않으므로 전체 vSphere를 사용할 수 없게 될 수 있습니다.
- CA를 사용하지 않는 경우 동일한 호스트의 노드를 동일한 vSphere에 유지할 수 있습니다. CA를 사용하지 않는 경우 노드 하나만 손실되어도 모든 VMware Aria Operations를 사용할 수 없게 될 수 있습니다.
- 양쪽 장애 도메인에서 데이터 노드의 전원을 끄고 VM의 네트워크 설정을 변경하면 데이터 노드의 IP 주소에 영향을 미칩니다. 이 시점 이후에 CA 클러스터에 더 이상 액세스할 수 없고 모든 노드 상태가
"Waiting for analytics"
로 변경됩니다. 정적 IP 주소를 사용했는지 확인하십시오. - 하나 이상의 vCenter 어댑터가 CA 활성화 클러스터로부터 데이터를 수집하도록 노드가 구성되어 있는 경우 해당 노드를 제거하면, 노드와 연결된 하나 이상의 vCenter 어댑터가 수집을 중지합니다. 노드를 제거하기 전에 어댑터가 다른 노드로 연결되도록 어댑터 구성을 변경해야 합니다.
- 관리 인터페이스에는 활성 개체에 대한 리소스 캐시 개수만 표시되는 반면 인벤토리에는 모든 개체가 표시됩니다. vCenter 어댑터에서 데이터를 수집하고 각 노드를 재조정하는 CA 활성화 클러스터에서 노드를 제거하는 경우 인벤토리와 관리 인터페이스에 표시되는 개체 수가 달라집니다.