VMware surveille les environnements SDDC clients en continu via l'automatisation et une équipe d'ingénieurs de fiabilité des sites (SRE). Les éléments suivants décrivent les processus que VMware automatise pour garantir la santé des SDDC.

Opérations de machines virtuelles

Correction automatique de la ou des machines virtuelles inactives
Si vous utilisez « Aucune redondance de données/VM avec FTT=0 » en tant que stratégie de stockage, vous risquez de perdre des données en cas de panne ou si la machine virtuelle ne répond plus. Si une panne se produit et qu'une ou plusieurs machines virtuelles deviennent inactives, VMware effectue une action de nettoyage. Vous recevrez une notification par e-mail lorsque cela se produit.

vCenter Operations

Dépassement du nombre maximal de sessions (connexions) vCenter
Si un grand nombre de sessions sont créées et non effacées, vCenter Server peut devenir inaccessible. En général, cela est dû à l'automatisation de la création d'un grand nombre de sessions. Cette action génère une alerte automatisée et VMware redémarrera vCenter Server. Vous recevrez une notification par e-mail lorsque cela se produit.
Redémarrage de vCenter Server
Un certain nombre de différents problèmes peuvent nécessiter un redémarrage de vCenter Server. Certains problèmes peuvent nécessiter un redémarrage immédiat pour être corrigés, tandis que d'autres peuvent permettre une utilisation continue avec un redémarrage requis prochainement. Dans ce dernier cas, vous recevrez une notification par e-mail vous avertissant qu'un redémarrage sera effectué dans les 24 heures qui suivent. Après un redémarrage, les tâches en cours et les connexions des applications peuvent devoir redémarrer.
Suppression du certificat d'une autorité de certification pour vCenter ayant expiré
Certaines intégrations de produits installent des certificats d'une autorité de certification sur vCenter. Si un certificat d'une autorité de certification a expiré, cela peut faire échouer l'ajout d'hôtes. Les certificats d'autorités de certification ayant expiré seront supprimés.

Opérations liées à NSX

Redémarrage du plan de gestion (NSX Manager)
Un certain nombre de différents problèmes peuvent nécessiter un redémarrage de NSX Manager. Certains problèmes peuvent nécessiter un redémarrage immédiat pour être corrigés, tandis que d'autres peuvent permettre une utilisation continue avec un redémarrage requis prochainement. Pendant la courte période durant laquelle NSX Manager est en cours de redémarrage, vous ne pouvez pas accéder à l'interface utilisateur de mise en réseau et de sécurité du SDDC. Vous ne recevrez pas de notification par e-mail pour les événements de redémarrage de NSX Manager.
Basculement NSX Edge
Si notre système de surveillance détecte qu'une instance de NSX Edge (active) est sur le point de devenir défectueuse, nous planifierons le basculement NSX Edge à des heures de faible activité. Ce basculement planifié est réalisé comme une mesure proactive afin d'éviter une interruption de service possible en cas de basculement à des heures de forte activité. En cas de problème avec l'instance de NSX Edge (active) avant le basculement planifié, le basculement est effectué automatiquement. Vous recevrez une notification par e-mail si nous planifions un basculement NSX Edge.

Opérations liées aux SDDC

Panne d'un SDDC à hôte unique
La configuration de démarrage d'un SDDC à hôte unique n'a aucun SLA et convient aux cas d'utilisation de validation technique ou de test et de développement. VMware n'effectue pas de correction en cas de panne d'un SDDC à hôte unique. Vous recevrez une notification par e-mail en cas de panne d'un SDDC à hôte unique.
Sauvegardes de SDDC
Nous sauvegardons chaque SDDC quotidiennement à 0900Z, ainsi qu'avant toute activité de maintenance planifiée.
  • Nous sauvegardons les éléments suivants : vCenter Server, configuration vSAN et NSX. Nous ne sauvegardons pas les données du client et les machines virtuelles de charge de travail.
  • Rétention des sauvegardes : durée de vie maximale de 28 jours et 56 sauvegardes au maximum. Les sauvegardes sont stockées chiffrées dans S3 dans la région du SDDC et supprimées lorsque le SDDC est supprimé. Vous ne pouvez pas récupérer un SDDC supprimé à partir d'une sauvegarde.
  • La récupération des composants de gestion est régie par votre SLA. VMware décidera s'il convient de récupérer à partir d'une sauvegarde ou d'effectuer une réparation.

Banques de données NFS

Disponibilité de la banque de données
Si les hôtes vSphere perdent l'accès à une banque de données NFS (tous chemins hors service) pendant plus de 320 secondes, vSphere HA mettra hors tension toutes les machines virtuelles sur l'hôte sur lequel des données étaient stockées dans la banque de données affectée. VMware HA tentera de redémarrer la machine virtuelle sur un hôte disposant d'une connexion saine à la banque de données.
Santé du SDDC
Si un hôte ne peut pas passer en mode de maintenance parce qu'une machine virtuelle en cours d'exécution ne peut pas être déplacée en raison d'une disponibilité partielle de la banque de données NFS, les opérations VMware mettront hors tension la machine virtuelle incriminée. VMware tentera de récupérer toute charge de travail affectée, mais les machines virtuelles resteront hors tension jusqu'à ce que l'accès au stockage soit rétabli et que vous les remettiez sous tension.