Catálogo de eventos de NSX
En las siguientes tablas se describen eventos que activan las alarmas en VMware NSX®, incluidos los mensajes de alarma y las acciones recomendadas para resolverlas. Cualquier evento con una gravedad superior aBAJOactiva una alarma. La información de alarmas se muestra en varias ubicaciones dentro de la interfaz de NSX Manager. La información de las alarmas y los eventos también se incluye con otras notificaciones en el menú desplegable Notificaciones de la barra de título. Para ver las alarmas, desplácese hasta la página inicio y haga clic en la pestaña Alarmas. Para obtener más información sobre alarmas y eventos, consulte "Trabajar con eventos y alarmas" en la Guía de administración de NSX.
Eventos de administración de alarmas
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Servicio de alarma sobrecargado | Crítico | global-manager, manager, aas | El servicio de alarma está sobrecargado. |
Revise todas las alarmas activas mediante la página Alarmas de la interfaz de usuario de NSX o la NSX API GET /api/v1/alarms?status=OPEN,ACKNOWLEDGED,SUPPRESSED. Para cada alarma activa, investigue la causa principal y aplique los pasos recomendados para la alarma. Cuando se solucionen el número suficiente de alarmas, el servicio de alarmas volverá a generar informes de alarmas nuevas. |
3.0.0 |
Volumen elevado de alarmas | Crítico | global-manager, manager, aas | Se detectó un volumen elevado de un tipo de alarma específico. |
Revise todas las alarmas activas del tipo {id_evento} mediante la página Alarmas de la interfaz de usuario de NSX o la siguiente NSX API: GET /api/v1/alarms?status=OPEN,ACKNOWLEDGED,SUPPRESSED. Para cada alarma activa, investigue la causa principal y aplique los pasos recomendados para la alarma. Cuando se solucionen el número suficiente de alarmas, el servicio de alarmas volverá a generar informes de alarmas nuevas de {id_evento}. |
3.0.0 |
Eventos de estado del registro de auditoría
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Error de actualización del archivo de registro de auditoría | Crítico | global-manager, manager, edge, public-cloud-gateway, esx, kvm, bms | No se puede escribir en al menos uno de los archivos de registro supervisados. |
1. En los nodos de Manager y Global Manager, los nodos de puerta de enlace de nube pública y Edge, y los nodos del host de KVM de Ubuntu garantizan que los permisos del directorio /var/log sean 775 y que la propiedad sea root:syslog. Un nodo de host de KVM y BMS de RHEL garantiza que el permiso para el directorio /var/log sea 755 y que la propiedad sea root:root. |
3.1.0 |
Error del servidor de registro remoto | Crítico | global-manager, manager, edge, public-cloud-gateway | Los mensajes de registro no se pueden entregar debido a una configuración incorrecta del servidor de registro remoto. |
1. Asegúrese de que {nombrehost_o_dirección_ip_con_puerto} sea el nombre de host o la dirección IP y el puerto correctos. |
3.1.0 |
Eventos de capacidad
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Umbral de capacidad mínima | Mediano | manager | Se ha infringido el umbral de capacidad mínima. |
Desplácese hasta la página Capacidad en la interfaz de usuario de NSX y revise el uso actual frente a los límites de umbral. Si se espera el uso actual; puede aumentar los valores del umbral mínimo. Si el uso actual es inesperado, revise las directivas de red configuradas para reducir el uso hasta el umbral mínimo o por debajo de él. |
3.1.0 |
Umbral de capacidad máxima | Alto | manager | Se ha infringido un umbral de capacidad máxima. |
Desplácese hasta la página Capacidad en la interfaz de usuario de NSX y revise el uso actual frente a los límites de umbral. Si se espera el uso actual; puede aumentar los valores del umbral máximo. Si el uso actual es inesperado, revise las directivas de red configuradas para reducir el uso hasta el umbral máximo o por debajo de él. |
3.1.0 |
Capacidad máxima | Crítico | manager | Se ha infringido la capacidad máxima. |
Asegúrese de que el número de objetos de NSX creados se encuentre dentro de los límites admitidos por NSX. Si hay objetos sin utilizar; elimínelos mediante la API o la interfaz de usuario de NSX correspondientes del sistema. Considere aumentar el formato de todos los nodos de Manager o de Edge. Tenga en cuenta que el formato de cada tipo de nodo debe ser el mismo. Si no es así, se utilizarán los límites de capacidad del formato más bajo implementado. |
3.1.0 |
Eventos de certificado
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Certificado caducado | Crítico | global-manager, manager | Un certificado caducó. |
Asegúrese de que se actualicen los servicios que están utilizando el certificado para que usen un nuevo certificado que no caduque. Una vez que el certificado caducado no esté en uso, deberá eliminarse invocando la siguiente NSX API: DELETE {ruta_colección_api}{id_entidad}. Si la plataforma NAPP utiliza el certificado caducado, se interrumpirá la conexión entre NSX y la plataforma NAPP. Consulte el documento de solución de problemas de la plataforma NAPP para utilizar un certificado de CA de NAPP autofirmado para recuperar la conexión. |
3.0.0 |
El certificado está a punto de caducar | Alto | global-manager, manager | Un certificado está a punto de caducar. |
Asegúrese de que los servicios que están utilizando el certificado se actualicen para usar un nuevo certificado que no esté a punto de caducar. Una vez que el certificado que iba a caducar no esté en uso, deberá eliminarse invocando la siguiente NSX API: DELETE {ruta_colección_api}{id_entidad}. |
3.0.0 |
Método de caducidad de certificados | Mediano | global-manager, manager | Un certificado caducará pronto. |
Asegúrese de que los servicios que están utilizando el certificado se actualicen para usar un nuevo certificado que no esté a punto de caducar. Una vez que el certificado que iba a caducar no esté en uso, deberá eliminarse invocando la siguiente NSX API: DELETE {ruta_colección_api}{id_entidad}. |
3.0.0 |
Actualización del paquete de CA recomendada | Alto | global-manager, manager | Se recomienda actualizar un paquete de CA de confianza. |
Asegúrese de que los servicios que utilizan actualmente el paquete de CA de confianza estén actualizados para utilizar un paquete de CA de confianza actualizado recientemente. A menos que sea un paquete proporcionado por el sistema, el paquete se puede actualizar mediante la NSX API PUT /policy/api/v1/infra/cabundles/{id_entidad}. Una vez que el paquete caducado ya no está en uso, debe eliminarse (si no está proporcionado por el sistema) invocando la NSX API DELETE /policy/api/v1/infra/cabundles/{id_entidad}. |
3.2.0 |
Actualización del paquete de CA sugerida | Mediano | global-manager, manager | Se sugiere actualizar un paquete de CA de confianza. |
Asegúrese de que los servicios que utilizan actualmente el paquete de CA de confianza estén actualizados para utilizar un paquete de CA de confianza actualizado recientemente. A menos que sea un paquete proporcionado por el sistema, el paquete se puede actualizar mediante la NSX API PUT /policy/api/v1/infra/cabundles/{id_entidad}. Una vez que el paquete caducado ya no está en uso, debe eliminarse (si no está proporcionado por el sistema) invocando la NSX API DELETE /policy/api/v1/infra/cabundles/{id_entidad}. |
3.2.0 |
El certificado del nodo de transporte caducó | Crítico | bms, edge, esx, kvm, public-cloud-gateway | Un certificado caducó. |
Reemplace el certificado del nodo de transporte {id_entidad} por un certificado que no esté caducado. El certificado caducado debe reemplazarse invocando NSX API POST /api/v1/trust-management/certificates/action/replace-host-certificate/{id_entidad}. Si el nodo de transporte utiliza el certificado caducado, se interrumpirá la conexión entre el nodo de transporte y el nodo de Manager. |
4.1.0 |
El certificado del nodo de transporte está a punto de caducar | Alto | bms, edge, esx, kvm, public-cloud-gateway | Un certificado está a punto de caducar. |
Reemplace el certificado del nodo de transporte {id_entidad} por un certificado que no esté caducado. El certificado caducado debe reemplazarse invocando NSX API POST /api/v1/trust-management/certificates/action/replace-host-certificate/{id_entidad}. Si no se reemplaza el certificado, cuando este caduque se interrumpirá la conexión entre el nodo de transporte y el nodo de Manager. |
4.1.0 |
La caducidad del certificado del nodo de transporte está próxima | Mediano | bms, edge, esx, kvm, public-cloud-gateway | Un certificado caducará pronto. |
Reemplace el certificado del nodo de transporte {id_entidad} por un certificado que no esté caducado. El certificado caducado debe reemplazarse invocando NSX API POST /api/v1/trust-management/certificates/action/replace-host-certificate/{id_entidad}. Si no se reemplaza el certificado, cuando este caduque se interrumpirá la conexión entre el nodo de transporte y el nodo de Manager. |
4.1.0 |
Eventos de agrupación de clústeres
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Clúster degradado | Mediano | global-manager, manager | El miembro del grupo está inactivo. |
1. Invoque el comando de la CLI de NSX 'get cluster status' para ver el estado de los miembros del grupo del clúster. |
3.2.0 |
Clúster no disponible | Alto | global-manager, manager | Todos los miembros del grupo del servicio están inactivos. |
1. Asegúrese de que el servicio de {tipo_grupo} se esté ejecutando en el nodo. Invoque la NSX API GET /api/v1/node/services/<nombre_servicio>/status o el comando de la CLI de NSX get service <nombre_servicio> para determinar si el servicio se está ejecutando. Si no se está ejecutando, invoque la NSX API POST /api/v1/node/services/<nombre_servicio>?action=restart o la CLI de NSX restart service <nombre_servicio> para reiniciar el servicio. |
3.2.0 |
Eventos de estado de CNI
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Conexión de HyperBus con Manager inactiva en DPU | Mediano | dpu | HyperBus en la DPU se puede comunicarse con el nodo de Manager. |
Es posible que falte la interfaz de VMkernel de HyperBus (vmk50) en la DPU {id_dpu}. Consulte el artículo de la base de conocimientos https://kb.vmware.com/s/article/67432. |
4.0.0 |
Conexión de HyperBus con Manager inactiva | Mediano | esx, kvm | HyperBus no se puede comunicar con el nodo de Manager. |
Es posible que falte la interfaz de VMkernel de HyperBus (vmk50). Consulte el artículo de la base de conocimientos https://kb.vmware.com/s/article/67432. |
3.0.0 |
Eventos de comunicación
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Disponibilidad limitada en DPU | Mediano | dpu | No se puede acceder al recopilador especificado a través de vmknic(s) en el DVS especificado en DPU. |
Si la advertencia está activada, no significa que no se pueda acceder al recopilador. Los flujos exportados generados por la vertical basada en DVS {alias_dvs} pueden seguir llegando al recopilador {ip_recopilador} a través de vmknic(s) en DVS, además de DVS {alias_dvs}. Si esto no es aceptable, el usuario puede intentar crear vmknics con {alias_pila} de pila en DVS {alias_dvs} y configurarlo con una dirección IPv4(6) personalizada y, a continuación, comprobar si se puede acceder al recopilador de {nombre_vertical} {ip_recopilador} a través de las vmknics recién creadas en la DPU {id_dpu} invocando vmkping {ip_recopilador} -S {alias_pila} -I vmkX con SSH a DPU a través de ESXi habilitado. |
4.0.1 |
Recopilador inaccesible en DPU | Crítico | dpu | No se puede acceder al recopilador especificado a través de vmknics existentes en DPU. |
Para que se pueda acceder al recopilador para la vertical especificada en el DVS, el usuario debe asegurarse de que haya vmknics con la pila esperada {alias_pila} creadas y configuradas con direcciones IPv4(6) adecuadas, y que la conexión de red al recopilador de {nombre_vertical} {ip_recopilador} también sea correcta. Por lo tanto, el usuario debe realizar la comprobación en DPU {id_dpu} y realizar la configuración necesaria para asegurarse de que se cumpla la condición. Por último, si vmkping {ip_recopilador} -S {alias_pila} con SSH a DPU a través de ESXi habilitado se realiza correctamente, esto indica que el problema está resuelto. |
4.0.1 |
Latencia del clúster de Manager alta | Mediano | manager | El promedio de latencia de red entre los nodos de Manager es alto. |
Asegúrese de que no haya reglas de firewall que bloqueen el tráfico de ping entre los nodos de Manager. Si hay otros servidores de gran ancho de banda y aplicaciones que comparten la red local, considere moverlas a una red diferente. |
3.1.0 |
Canal de control al nodo de Manager inactivo demasiado tiempo | Crítico | bms, edge, esx, kvm, public-cloud-gateway | La conexión del plano de control del nodo de transporte con el nodo de Manager está inactiva desde hace mucho tiempo. |
1. Compruebe la conectividad desde el nodo de transporte {id_entidad} a la interfaz del nodo de Manager {dirección_dispositivo} haciendo ping. Si no se puede hacer ping, compruebe si la conectividad de red es inestable. |
3.1.0 |
Canal de control a nodo de Manager inactivo | Mediano | bms, edge, esx, kvm, public-cloud-gateway | La conexión del plano de control del nodo de transporte al nodo de Manager está inactiva. |
1. Compruebe la conectividad desde el nodo de transporte {id_entidad} a la interfaz del nodo de Manager {dirección_dispositivo} haciendo ping. Si no se puede hacer ping, compruebe si la conectividad de red es inestable. |
3.1.0 |
Canal de control a nodo de transporte inactivo | Mediano | manager | La conexión del servicio de controlador al nodo de transporte está inactiva. |
1. Compruebe la conectividad desde el servicio de controlador {id_plano_control_central} y la interfaz del nodo de transporte {id_entidad} mediante ping y traceroute. Esto se puede realizar en la CLI admin del nodo de NSX Manager. La prueba de ping no debe detectar descartes y debe tener valores de latencia coherentes. VMware recomienda valores de latencia de 150 ms o menos. |
3.1.0 |
Canal de control a nodo de transporte inactivo mucho tiempo | Crítico | manager | La conexión del servicio de controlador al nodo de transporte lleva inactiva demasiado tiempo. |
1. Compruebe la conectividad desde el servicio de controlador {id_plano_control_central} y la interfaz del nodo de transporte {id_entidad} mediante ping y traceroute. Esto se puede realizar en la CLI admin del nodo de NSX Manager. La prueba de ping no debe detectar descartes y debe tener valores de latencia coherentes. VMware recomienda valores de latencia de 150 ms o menos. |
3.1.0 |
Canal de control de Manager inactivo | Crítico | manager | El canal de Manager al controlador está inactivo. |
1. En el nodo de administración {nombre_nodo_manager} ({dirección_dispositivo}), invoque el siguiente comando de la CLI de NSX: get service applianceproxy para comprobar periódicamente el estado del servicio durante 60 minutos. |
3.0.2 |
Canal de administración para el nodo de transporte inactivo | Mediano | manager | El canal de administración para el nodo de transporte está inactivo. |
Asegúrese de que haya conectividad de red entre los nodos de Manager y el nodo de transporte {nombre_nodo_transporte} ({dirección_nodo_transporte}) y que ningún firewall bloquee el tráfico entre los nodos. En los nodos de transporte de Windows, asegúrese de que se esté ejecutando el servicio nsx-proxy invocando el comando C:\NSX\nsx-proxy\nsx-proxy.ps1 status en Windows PowerShell. Si no se está ejecutando, reinícielo con el comando C:\NSX\nsx-proxy\nsx-proxy.ps1 restart. En todos los nodos de transporte, asegúrese de que se esté ejecutando el servicio nsx-proxy invocando el comando /etc/init.d/nsx-proxy status. Si no se está ejecutando, reinícielo con el comando /etc/init.d/nsx-proxy restart. |
3.0.2 |
Canal de administración para el nodo de transporte inactiva mucho tiempo | Crítico | manager | El canal de administración al nodo de transporte lleva inactivo demasiado tiempo. |
Asegúrese de que haya conectividad de red entre los nodos de Manager y el nodo de transporte {nombre_nodo_transporte} ({dirección_nodo_transporte}) y que ningún firewall bloquee el tráfico entre los nodos. En los nodos de transporte de Windows, asegúrese de que se esté ejecutando el servicio nsx-proxy invocando el comando C:\NSX\nsx-proxy\nsx-proxy.ps1 status en Windows PowerShell. Si no se está ejecutando, reinícielo con el comando C:\NSX\nsx-proxy\nsx-proxy.ps1 restart. En todos los nodos de transporte, asegúrese de que se esté ejecutando el servicio nsx-proxy invocando el comando /etc/init.d/nsx-proxy status. Si no se está ejecutando, reinícielo con el comando /etc/init.d/nsx-proxy restart. |
3.0.2 |
Error de búsqueda de FQDN de Manager | Crítico | global-manager, bms, edge, esx, kvm, manager, public-cloud-gateway | Error en la búsqueda de DNS para el FQDN del nodo de Manager. |
1. Asigne los FQDN correctos a todos los nodos de Manager y compruebe que la configuración de DNS sea correcta para la búsqueda correcta de los FQDN de todos los nodos de Manager. |
3.1.0 |
Error de búsqueda inversa de FQDN de Manager | Crítico | global-manager, manager | Error en la búsqueda inversa de DNS para la dirección IP del nodo de Manager. |
1. Asigne los FQDN correctos a todos los nodos de Manager y compruebe que la configuración de DNS sea correcta para la búsqueda inversa correcta de la dirección IP del nodo de Manager. |
3.1.0 |
Canal de administración a nodo de Manager inactivo | Mediano | bms, edge, esx, kvm, public-cloud-gateway | El canal de administración para el nodo de Manager está inactivo. |
Asegúrese de que haya conectividad de red entre el nodo de transporte {id_nodo_transporte} y el nodo principal de Manager. Asegúrese también de que ningún firewall bloquee el tráfico entre los nodos. Asegúrese de que el servicio messaging-manager se esté ejecutando en los nodos de Manager mediante el comando /etc/init.d/messaging-manager status. Si el servicio messaging-manager no se está ejecutando, reinícielo invocando el comando /etc/init.d/messaging-manager restart. |
3.2.0 |
Canal de administración a nodo de Manager inactivo mucho tiempo | Crítico | bms, edge, esx, kvm, public-cloud-gateway | El canal de administración al nodo de Manager lleva inactivo demasiado tiempo. |
Asegúrese de que haya conectividad de red entre el nodo de transporte {id_nodo_transporte} y los nodos principales de Manager. Asegúrese también de que ningún firewall bloquee el tráfico entre los nodos. Asegúrese de que el servicio messaging-manager se esté ejecutando en los nodos de Manager mediante el comando /etc/init.d/messaging-manager status. Si el servicio messaging-manager no se está ejecutando, reinícielo invocando el comando /etc/init.d/messaging-manager restart. |
3.2.0 |
Latencia de red alta | Mediano | manager | La latencia de red del nodo de transporte de administración es alta. |
1. Espere 5 minutos para ver si la alarma se resuelve automáticamente. |
4.0.0 |
Eventos de DHCP
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Error en la asignación de concesión de grupo | Alto | edge, autonomous-edge, public-cloud-gateway | Se agotaron las direcciones IP en un grupo de direcciones IP. |
Revise la configuración del grupo de DHCP en la interfaz de usuario de NSX o en el nodo de Edge en el que se ejecuta el servidor DHCP invocando el comando de la CLI de NSX get dhcp ip-pool. También puede revisar las concesiones activas actuales en el nodo de Edge invocando el comando de la CLI de NSX get dhcp lease. Compare las concesiones con el número de máquinas virtuales activas. Es recomendable reducir el tiempo de concesión en la configuración del servidor DHCP si el número de máquinas virtuales es bajo en comparación con el número de concesiones activas. También puede expandir el rango de grupos del servidor DHCP en la página Redes | Segmentos | Segmento en la interfaz de usuario de NSX. |
3.0.0 |
Grupo sobrecargado | Mediano | edge, autonomous-edge, public-cloud-gateway | Un grupo de direcciones IP está sobrecargado. |
Revise la configuración del grupo de DHCP en la interfaz de usuario de NSX o en el nodo de Edge en el que se ejecuta el servidor DHCP invocando el comando de la CLI de NSX get dhcp ip-pool. También puede revisar las concesiones activas actuales en el nodo de Edge invocando el comando de la CLI de NSX get dhcp lease. Compare las concesiones con el número de máquinas virtuales activas. Es recomendable reducir el tiempo de concesión en la configuración del servidor DHCP si el número de máquinas virtuales es bajo en comparación con el número de concesiones activas. También puede expandir el rango de grupos del servidor DHCP en la página Redes | Segmentos | Segmento en la interfaz de usuario de NSX. |
3.0.0 |
Eventos de firewall distribuido
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Uso de CPU de DFW muy alto | Crítico | esx | El uso de la CPU del DFW es muy alto. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. Revise el diseño de seguridad para optimizarlo. Por ejemplo, utilice la configuración de apply-to si las reglas no se aplican a todo el centro de datos. |
3.0.0 |
Uso de CPU de DFW muy alto en DPU | Crítico | dpu | El uso de CPU de DFW es muy alto en DPU. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. Revise el diseño de seguridad para optimizarlo. Por ejemplo, utilice la configuración de apply-to si las reglas no se aplican a todo el centro de datos. |
4.0.0 |
Uso de memoria de DFW muy alto | Crítico | esx | El uso de la memoria del DFW es muy alto. |
Para ver el uso actual de la memoria de DFW, invoque el comando de la CLI de NSX get firewall thresholds en el host. Es recomendable volver a equilibrar las cargas de trabajo en este host con otros hosts. |
3.0.0 |
Uso de memoria de DFW muy alto en DPU | Crítico | dpu | El uso de memoria de DFW es muy alto en DPU. |
Para ver el uso actual de la memoria de DFW, invoque el comando de la CLI de NSX get firewall thresholds en la DPU. Es recomendable volver a equilibrar las cargas de trabajo en este host con otros hosts. |
4.0.0 |
Error de vMotion de DFW | Crítico | esx | Error de vMotion de DFW (puerto desconectado). |
Compruebe las máquinas virtuales del host en NSX Manager, vuelva a insertar manualmente la configuración de DFW a través de la interfaz de usuario de NSX Manager. El filtro de DFW {id_entidad} puede rastrear la directiva de DFW que se va a volver a insertar. También puede buscar la máquina virtual a la que está asociado el filtro de DFW y reiniciarla. |
3.2.0 |
Límite de advertencia de inundación de DFW | Mediano | esx | El límite de inundación de DFW alcanzó el nivel de advertencia. |
Compruebe las máquinas virtuales del host en NSX Manager y compruebe el nivel de advertencia de inundación configurado del filtro de DFW {id_entidad} para el protocolo {nombre_protocolo}. |
4.1.0 |
Límite crítico de inundación de DFW | Crítico | esx | El límite de inundación de DFW alcanzó el nivel crítico. |
Compruebe las máquinas virtuales del host en NSX Manager y compruebe el nivel crítico de inundación configurado del filtro de DFW {id_entidad} para el protocolo {nombre_protocolo}. |
4.1.0 |
Número alto de sesiones de DFW | Crítico | esx | El número de sesiones de DFW es alto. |
Revise el nivel de carga de tráfico de red de las cargas de trabajo en el host. Es recomendable volver a equilibrar las cargas de trabajo en este host con otros hosts. |
3.2.0 |
Se superó el límite de reglas de DFW por vNIC | Crítico | esx | El límite de reglas de DFW por vNIC está a punto de superar el límite máximo. |
Inicie sesión en el host ESX {nombre_nodo_transporte} e invoque el comando de la CLI de NSX get firewall <UUID_VIF> ruleset rules para obtener las estadísticas de las reglas configuradas en la VIF correspondiente. Reduzca el número de reglas configuradas para la VIF {id_entidad}. |
4.0.0 |
El límite de reglas de DFW por vNIC está próximo | Mediano | esx | El límite de reglas de DFW por vNIC está próximo al límite máximo. |
Inicie sesión en el host ESX {nombre_nodo_transporte} e invoque el comando de la CLI de NSX get firewall <UUID_VIF> ruleset rules para obtener las estadísticas de las reglas configuradas en la VIF correspondiente. Reduzca el número de reglas configuradas para la VIF {id_entidad}. |
4.0.0 |
Se superó el límite de reglas de DFW por host | Crítico | esx | El límite de reglas de DFW por host está a punto de superar el límite máximo. |
Inicie sesión en el host ESX {nombre_nodo_transporte} e invoque el comando de la CLI de NSX get firewall rule-stats total para obtener las estadísticas de las reglas configuradas en el host ESX {nombre_nodo_transporte}. Reduzca el número de reglas configuradas para el host {nombre_nodo_transporte}. Compruebe el número de reglas configuradas para varias VIF usando el comando de la CLI de NSX get firewall <UUID_VIF> ruleset rules. Reduzca el número de reglas configuradas para varias VIF. |
4.0.0 |
El límite de reglas de DFW por host está próximo | Mediano | esx | El límite de reglas de DFW por host está próximo al límite máximo. |
Inicie sesión en el host ESX {nombre_nodo_transporte} e invoque el comando de la CLI de NSX get firewall rule-stats total para obtener las estadísticas de las reglas configuradas en el host ESX {nombre_nodo_transporte}. Reduzca el número de reglas configuradas para el host {nombre_nodo_transporte}. Compruebe el número de reglas configuradas para varias VIF usando el comando de la CLI de NSX get firewall <UUID_VIF> ruleset rules. Reduzca el número de reglas configuradas para varias VIF. |
4.0.0 |
Eventos de IDS/IPS distribuido
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Se alcanzó el número máximo de eventos | Mediano | manager | Se alcanzó el número máximo de eventos de intrusión. |
No se requiere ninguna intervención manual. Se iniciará automáticamente un trabajo de purga cada 3 minutos que eliminará el 10 % de los registros anteriores para que el número total de eventos de intrusión en el sistema sea menor que el valor del umbral de 1,5 millones de eventos. |
3.1.0 |
Uso de memoria del motor NSX IDPS alto | Mediano | esx | El uso de la memoria del motor NSX IDPS alcanzó al menos el 75%. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
3.1.0 |
Uso de memoria del motor NSX IDPS alto en DPU | Mediano | dpu | El uso de la memoria del motor NSX IDPS alcanzó al menos el 75 % en DPU. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
4.0.0 |
Uso de memoria del motor NSX IDPS medio alto | Alto | esx | El uso de la memoria del motor NSX IDPS alcanzó al menos el 85 %. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
3.1.0 |
Uso de memoria del motor NSX IDPS medio en DPU | Alto | dpu | El uso de la memoria del motor NSX IDPS alcanzó al menos el 85% en DPU. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
4.0.0 |
Uso de memoria del motor NSX IDPS muy alto | Crítico | esx | El uso de la memoria del motor NSX IDPS alcanzó al menos el 95 %. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
3.1.0 |
Uso de memoria del motor NSX IDPS muy alto en DPU | Crítico | dpu | El uso de la memoria del motor NSX IDPS alcanzó al menos el 95% en DPU. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
4.0.0 |
Uso de CPU del motor NSX IDPS alto | Mediano | esx | El uso de la CPU del motor NSX IDPS alcanzó al menos el 75 %. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
3.1.0 |
Uso de CPU del motor NSX IDPS medio | Alto | esx | El uso de la CPU del motor NSX IDPS alcanzó al menos el 85 %. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
3.1.0 |
Uso de CPU del motor NSX IDPS muy alto | Crítico | esx | El uso de la CPU del motor NSX IDPS superó el 95 %. |
Es recomendable volver a equilibrar las cargas de trabajo de la máquina virtual en este host con otros hosts. |
3.1.0 |
Motor NSX IDPS inactivo | Crítico | esx | NSX IDPS está habilitado a través de la directiva de NSX y las reglas IDPS están configuradas, pero el motor NSX-IDPS está inactivo. |
1. Compruebe /var/log/nsx-syslog.log para ver si se han notificado errores. |
3.1.0 |
Motor NSX IDPS inactivo en DPU | Crítico | dpu | NSX IDPS está habilitado a través de la directiva de NSX y las reglas IDPS están configuradas, pero el motor NSX-IDPS está inactivo en DPU. |
1. Compruebe /var/log/nsx-idps/nsx-idps.log y /var/log/nsx-syslog.log para ver si se notificaron errores. |
4.0.0 |
Sobresuscripción de CPU del motor de IDPS alta | Mediano | esx | El uso de la CPU para el motor IDPS distribuido es alto. |
Revise el motivo de la sobresuscripción. Mueva algunas aplicaciones a un host diferente. |
4.0.0 |
Sobresuscripción de CPU del motor de IDPS muy alta | Alto | esx | El uso de la CPU para el motor IDPS distribuido es muy alto. |
Revise el motivo de la sobresuscripción. Mueva algunas aplicaciones a un host diferente. |
4.0.0 |
Sobresuscripción de red del motor de IDPS alta | Mediano | esx | El uso de la red para el motor IDPS distribuido es alto. |
Revise el motivo de la sobresuscripción. Revise las reglas de IDPS para reducir la cantidad de tráfico sujeto al servicio IDPS. |
4.0.0 |
Sobresuscripción de red del motor de IDPS muy alta | Alto | esx | El uso de la red para el motor IDPS distribuido es muy alto. |
Revise el motivo de la sobresuscripción. Revise las reglas de IDPS para reducir la cantidad de tráfico sujeto al servicio IDPS. |
4.0.0 |
El motor IDPS descartó tráfico - Exceso de suscripciones de CPU | Crítico | esx | El motor IDPS distribuido descartó tráfico debido al exceso de suscripciones de la CPU |
Revise el motivo de la sobresuscripción. Mueva algunas aplicaciones a un host diferente. |
4.0.0 |
El motor IDPS descartó tráfico - Exceso de suscripciones de red | Crítico | esx | El motor IDPS distribuido descartó tráfico debido al exceso de suscripciones de la red |
Revise el motivo de la sobresuscripción. Revise las reglas de IDPS para reducir la cantidad de tráfico sujeto al servicio IDPS. |
4.0.0 |
El motor IDPS omitió tráfico - Exceso de suscripciones de CPU | Crítico | esx | El motor IDPS distribuido omitió tráfico debido al exceso de suscripciones de la CPU |
Revise el motivo de la sobresuscripción. Mueva algunas aplicaciones a un host diferente. |
4.0.0 |
El motor IDPS omitió tráfico - Exceso de suscripciones de red | Crítico | esx | El motor IDPS distribuido omitió tráfico debido al exceso de suscripciones de la red |
Revise el motivo de la sobresuscripción. Revise las reglas de IDPS para reducir la cantidad de tráfico sujeto al servicio IDPS. |
4.0.0 |
Eventos de DNS
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Reenviador inactivo | Alto | edge, autonomous-edge, public-cloud-gateway | Un reenviador de DNS está inactivo. |
1. Invoque el comando de la CLI de NSX get dns-forwarders status para comprobar si el reenviador de DNS está inactivo. |
3.0.0 |
Reenviador deshabilitado | Información | edge, autonomous-edge, public-cloud-gateway | Un reenviador de DNS está deshabilitado. |
1. Invoque el comando de la CLI de NSX get dns-forwarders status para comprobar si el reenviador de DNS está deshabilitado. |
3.0.0 |
Tiempo de espera del servidor upstream del reenviador | Alto | edge, autonomous-edge, public-cloud-gateway | Se agotó el tiempo de espera de un servidor upstream del reenviador DNS. |
1. Invoque la NSX API GET /api/v1/dns/forwarders/{id_dns}/nslookup? address=<dirección>&server_ip={ip_upstream_dns}&source_ip=<ip_origen>. Esta solicitud de API activa una búsqueda de DNS en el servidor upstream del espacio de nombres de red del reenviador DNS. <dirección> es la dirección IP o el FQDN en el mismo dominio que el servidor upstream. <ip_origen> es una dirección IP en la zona del servidor upstream. Si la API devuelve una respuesta de que se agotó el tiempo de espera de la conexión, es probable que haya un error de red o un problema con el servidor upstream. Compruebe por qué las búsquedas de DSN no están llegando al servidor upstream o por qué el servidor upstream no devuelve una respuesta. Si la respuesta de la API indica que el servidor upstream responde, continúe con el paso 2. |
3.1.3 |
Eventos de Edge
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
La configuración del nodo de Edge no coincide | Crítico | manager | La configuración del nodo de Edge no coincide. |
Revise los ajustes del nodo de transporte de Edge {id_entidad}. Siga una de estas acciones para resolver la alarma: |
3.2.0 |
Error de coincidencia de la configuración de vSphere de máquina virtual de Edge | Crítico | manager | Error de coincidencia de la configuración de vSphere de máquina virtual de Edge. |
Revise la configuración vSphere de este nodo de transporte de Edge {id_entidad}. Siga una de estas acciones para resolver la alarma: |
3.2.0 |
Se cambió la configuración del nodo de Edge y la configuración de vSphere | Crítico | manager | Se cambió la configuración del nodo de Edge y la configuración de vSphere. |
Revise los ajustes del nodo y la configuración de vSphere de este nodo de transporte de Edge {id_entidad}. Siga una de estas acciones para resolver la alarma: |
3.2.0 |
Error de coincidencia de ubicación de vSphere de Edge | Alto | manager | Error de coincidencia de ubicación de vSphere de Edge. |
Revise la configuración vSphere de este nodo de transporte de Edge {id_entidad}. Siga una de estas acciones para resolver la alarma: |
3.2.0 |
La máquina virtual de Edge está en el inventario de NSX, pero no en vCenter | Crítico | manager | La máquina virtual de Edge automática está en el inventario de NSX, pero no en vCenter. |
El identificador de referencia de objeto administrado de una máquina virtual tiene el formato vm-número que se puede ver en la URL al seleccionar la máquina virtual de Edge en la interfaz de usuario de vCenter. Por ejemplo, vm-12011 en https://<url-vc>/ui/app/vm;nav=h/urn:vmomi:VirtualMachine:vm-12011:164ff798-c4f1-495b-a0be-adfba337e5d2/summary. Busque la máquina virtual {nombre_vm_edge_directiva} con el identificador de MoRef {id_moref_vm} en vCenter para el nodo de transporte de Edge {id_entidad}. Si la máquina virtual de Edge está en vCenter con un identificador MoRef diferente, haga lo siguiente. Utilice la API para agregar o actualizar de NSX con las propiedades de carga útil de la solicitud JSON vm_id y vm_deployment_config para actualizar el nuevo identificador de MoRef de la máquina virtual y los parámetros de implementación de vSphere. POST https://<ip-manager>/api/v1/transport-nodes/<id-tn>?action=addOrUpdatePlacementReferences. Si la máquina virtual de Edge con el nombre {nombre_vm_edge_directiva} no está en vCenter, utilice la API de reimplementación de NSX para implementar una nueva máquina virtual para el nodo de Edge. POST https://<ip-manager>/api/v1/transport-nodes/<id-tn>?action=redeploy. |
3.2.1 |
La máquina virtual de Edge no está ni en el inventario de NSX ni en vCenter | Crítico | manager | La máquina virtual de Edge automática no está ni en el inventario de NSX ni en vCenter. |
El identificador de referencia de objeto administrado de una máquina virtual tiene el formato vm-número que se puede ver en la URL al seleccionar la máquina virtual de Edge en la interfaz de usuario de vCenter. Por ejemplo, vm-12011 en https://<url-vc>/ui/app/vm;nav=h/urn:vmomi:VirtualMachine:vm-12011:164ff798-c4f1-495b-a0be-adfba337e5d2/summary. Busque la máquina virtual {nombre_vm_edge_directiva} con el identificador de MoRef {id_moref_vm} en vCenter para el nodo de transporte de Edge {id_entidad}. Haga lo siguiente para resolver la alarma: - Compruebe si la máquina virtual se eliminó en vSphere o si tiene un identificador de MoRef diferente. |
3.2.1 |
No se pudo eliminar la máquina virtual anterior en vCenter al volver a implementar | Crítico | manager | Se produjo un error en la operación de apagado y eliminación de la máquina virtual de Edge anterior en vCenter al volver a implementar. |
El identificador de referencia de objeto administrado de una máquina virtual tiene el formato vm-número que se puede ver en la URL al seleccionar la máquina virtual de Edge en la interfaz de usuario de vCenter. Por ejemplo, vm-12011 en https://<url-vc>/ui/app/vm;nav=h/urn:vmomi:VirtualMachine:vm-12011:164ff798-c4f1-495b-a0be-adfba337e5d2/summary. Busque la máquina virtual {nombre_vm_edge_directiva} con el identificador de MoRef {id_moref_vm} en vCenter para el nodo de transporte de Edge {id_entidad}. Apague y elimine la máquina virtual de Edge anterior {nombre_vm_edge_directiva} con el identificador de MoRef {id_moref_vm} en vCenter. |
3.2.1 |
Error de coincidencia de versiones de hardware de Edge | Mediano | manager | La versión de hardware del nodo de Edge no coincide. |
Siga el artículo de la base de conocimientos para resolver la alarma por el error de coincidencia de versiones de hardware para el nodo de Edge {nombre_nodo_transporte}. |
4.0.1 |
Eventos de clústeres de Edge
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Error de reubicación de miembro del clúster de Edge | Crítico | manager | Alarma de error de reubicación de miembro de clúster de Edge |
Revise la capacidad disponible para el clúster de Edge. Si se requiere más capacidad, escale el clúster de Edge. Vuelva a intentar la operación de reubicar miembros del clúster de Edge. |
4.0.0 |
Eventos de estado de Edge
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Uso de CPU de Edge muy alto | Crítico | edge, public-cloud-gateway | El uso de la CPU del nodo de Edge es muy alto. |
Revise la configuración, los servicios en ejecución y el tamaño de este nodo de Edge. Es recomendable ajustar el tamaño del factor de forma del dispositivo Edge o reequilibrar los servicios a otros nodos de Edge según la carga de trabajo correspondiente. |
3.0.0 |
Uso de CPU de Edge alto | Mediano | edge, public-cloud-gateway | El uso de la CPU del nodo de Edge es alto. |
Revise la configuración, los servicios en ejecución y el tamaño de este nodo de Edge. Es recomendable ajustar el tamaño del factor de forma del dispositivo Edge o reequilibrar los servicios a otros nodos de Edge según la carga de trabajo correspondiente. |
3.0.0 |
Uso de memoria de Edge muy alto | Crítico | edge, public-cloud-gateway | El uso de la memoria del nodo de Edge es muy alto. |
Revise la configuración, los servicios en ejecución y el tamaño de este nodo de Edge. Es recomendable ajustar el tamaño del factor de forma del dispositivo Edge o reequilibrar los servicios a otros nodos de Edge según la carga de trabajo correspondiente. |
3.0.0 |
Uso de memoria de Edge alto | Mediano | edge, public-cloud-gateway | El uso de la memoria del nodo de Edge es alto. |
Revise la configuración, los servicios en ejecución y el tamaño de este nodo de Edge. Es recomendable ajustar el tamaño del factor de forma del dispositivo Edge o reequilibrar los servicios a otros nodos de Edge según la carga de trabajo correspondiente. |
3.0.0 |
Uso de disco de Edge muy alto | Crítico | edge, public-cloud-gateway | El uso del disco del nodo de Edge es muy alto. |
Examine la partición con un uso elevado y compruebe si hay archivos inesperadamente grandes que se puedan eliminar. |
3.0.0 |
Uso de disco de Edge alto | Mediano | edge, public-cloud-gateway | El uso del disco del nodo de Edge es alto. |
Examine la partición con un uso elevado y compruebe si hay archivos inesperadamente grandes que se puedan eliminar. |
3.0.0 |
Uso muy alto de la CPU en la ruta de datos de Edge | Crítico | edge, autonomous-edge, public-cloud-gateway | El uso de la CPU de la ruta de datos del nodo de Edge es muy alto. |
Revise las estadísticas de CPU en el nodo de Edge invocando el comando de la CLI de NSX get dataplane cpu stats para mostrar las tasas de paquetes por núcleo de CPU. Se espera un uso de CPU más alto con tasas de paquetes mayores. Es recomendable aumentar el tamaño del factor de forma del dispositivo Edge y reequilibrar los servicios en este nodo de Edge a otros nodos de Edge en el mismo clúster u otros clústeres de Edge. |
3.0.0 |
Uso alto de la CPU en la ruta de datos de Edge | Mediano | edge, autonomous-edge, public-cloud-gateway | El uso de la CPU de la ruta de datos del nodo de Edge es alto. |
Revise las estadísticas de CPU en el nodo de Edge invocando el comando de la CLI de NSX get dataplane cpu stats para mostrar las tasas de paquetes por núcleo de CPU. Se espera un uso de CPU más alto con tasas de paquetes mayores. Es recomendable aumentar el tamaño del factor de forma del dispositivo Edge y reequilibrar los servicios en este nodo de Edge a otros nodos de Edge en el mismo clúster u otros clústeres de Edge. |
3.0.0 |
Error de configuración de la ruta de datos de Edge | Alto | edge, autonomous-edge, public-cloud-gateway | No se pudo configurar la ruta de datos de los nodos de Edge. |
Asegúrese de que la conectividad del nodo de Edge con el nodo de Manager sea correcta. Desde la CLI de NSX del nodo de Edge, invoque el comando get services para comprobar el estado de los servicios. Si se detiene el servicio de plano de datos, invoque al comando start service dataplane para iniciarlo. |
3.0.0 |
Controlador criptográfico de la ruta de datos de Edge inactivo | Crítico | edge, autonomous-edge, public-cloud-gateway | El controlador criptográfico del nodo de Edge está inactivo. |
Actualice el nodo de Edge según sea necesario. |
3.0.0 |
Grupo de memoria en la ruta de datos de Edge alto | Mediano | edge, autonomous-edge, public-cloud-gateway | El uso del grupo de memoria de la ruta de datos del nodo de Edge es alto. |
Inicie sesión como usuario raíz e invoque los comandos edge-appctl -t /var/run/vmware/edge/dpd.ctl mempool/show y edge-appctl -t /var/run/vmware/edge/dpd.ctl memory/show malloc_heap para comprobar el uso de memoria de DPDK. |
3.0.0 |
Uso alto de tabla ARP global de Edge | Mediano | edge, autonomous-edge, public-cloud-gateway | El uso de la tabla ARP global del nodo de Edge es alto. |
Inicie sesión como usuario raíz, invoque el comando edge-appctl -t /var/run/vmware/edge/dpd.ctl neigh/show y compruebe si el uso de la memoria caché de neigh es normal. Si es así, invoque el comando edge-appctl -t /var/run/vmware/edge/dpd.ctl neigh/set_param max_entries para aumentar el tamaño de la tabla ARP. |
3.0.0 |
NIC de Edge fuera del búfer de recepción | Mediano | edge, autonomous-edge, public-cloud-gateway | La NIC del nodo de Edge no tiene búferes de anillo RX temporalmente. |
Ejecute el comando de la CLI de NSX get dataplane cpu stats en el nodo de Edge y compruebe lo siguiente: |
3.0.0 |
NIC de Edge fuera del búfer de transmisión | Crítico | edge, autonomous-edge, public-cloud-gateway | La NIC del nodo de Edge no tiene búferes de anillo TX temporalmente. |
1. Si el hipervisor admite una gran cantidad de máquinas virtuales junto con la instancia de Edge, es posible que la máquina virtual de Edge no obtenga tiempo para ejecutarse, por lo que el hipervisor no podrá recuperar los paquetes. A continuación, es probable que la máquina virtual de Edge se migre a un host con menos máquinas virtuales. |
3.0.0 |
Estado de vínculo de NIC de Edge inactivo | Crítico | edge, autonomous-edge, public-cloud-gateway | El vínculo de NIC del nodo de Edge está inactivo. |
En el nodo de Edge, confirme si el vínculo de NIC está físicamente inactivo invocando el comando de la CLI de NSX get interfaces. Si está inactivo, compruebe la conexión del cable. |
3.0.0 |
Error de almacenamiento | Crítico | edge, autonomous-edge, public-cloud-gateway | El disco del nodo de Edge es de solo lectura. |
Examine la partición de solo lectura para ver si el reinicio resuelve el problema o si se debe reemplazar el disco. Póngase en contacto con GSS para obtener más información. |
3.0.1 |
Subproceso de ruta de datos interbloqueado | Crítico | edge, autonomous-edge, public-cloud-gateway | El subproceso de la ruta de datos del nodo de Edge se encuentra en una condición de interbloqueo. |
Reinicie el servicio de plano de datos invocando el comando de la CLI de NSX restart service dataplane. |
3.1.0 |
Rendimiento muy alto de la NIC en la ruta de datos de Edge | Crítico | edge, autonomous-edge, public-cloud-gateway | El rendimiento de la NIC de la ruta de datos del nodo de Edge es muy alto. |
Examine los niveles de tráfico en la NIC y determine si se necesitan cambios de configuración. El comando 'get dataplane thoughput <segundos>' se puede utilizar para supervisar el rendimiento. |
3.2.0 |
Rendimiento alto de la NIC en la ruta de datos de Edge | Mediano | edge, autonomous-edge, public-cloud-gateway | El rendimiento de la NIC de la ruta de datos del nodo de Edge es alto. |
Examine los niveles de tráfico en la NIC y determine si se necesitan cambios de configuración. El comando 'get dataplane thoughput <segundos>' se puede utilizar para supervisar el rendimiento. |
3.2.0 |
Error en el dominio no administrado | Crítico | edge, public-cloud-gateway | Todos los miembros del dominio de errores están inactivos. |
1. En el nodo de Edge identificado por {id_nodo_transporte}, compruebe la conectividad con los planos de administración y control invocando el comando de la CLI de NSX get managers y get controllers. |
3.2.0 |
Frecuencia de aciertos de caché de microflujo baja | Mediano | edge, autonomous-edge, public-cloud-gateway | La frecuencia de aciertos de la memoria caché de microflujo disminuye y la CPU de Datapath es alta. |
La frecuencia de aciertos de flujo de memoria caché ha disminuido durante los últimos 30 minutos, lo que indica que el rendimiento de Edge puede degradarse. El tráfico se seguirá reenviando y es posible que no experimente ningún problema. Compruebe si uso de la CPU de la ruta de datos para Edge {id_entidad} núcleo {id_núcleo} es alto durante los últimos 30 minutos. La instancia de Edge tendrá una frecuencia de aciertos de caché de flujos baja cuando se creen continuamente nuevos flujos, ya que el primer paquete de cualquier flujo nuevo se utilizará para configurar la caché de flujos para procesar rápido la ruta de acceso. Es recomendable aumentar el tamaño del dispositivo de Edge o aumentar el número de nodos de Edge utilizados para las puertas de enlace activas/activas. |
3.2.2 |
Frecuencia de aciertos de caché de megaflujo baja | Mediano | edge, autonomous-edge, public-cloud-gateway | La frecuencia de aciertos de la memoria caché de megaflujo disminuye y la CPU de la ruta de datos es alta. |
La frecuencia de aciertos de flujo de memoria caché ha disminuido durante los últimos 30 minutos, lo que indica que el rendimiento de Edge puede degradarse. El tráfico se seguirá reenviando y es posible que no experimente ningún problema. Compruebe si uso de la CPU de la ruta de datos para Edge {id_entidad} núcleo {id_núcleo} es alto durante los últimos 30 minutos. La instancia de Edge tendrá una frecuencia de aciertos de caché de flujos baja cuando se creen continuamente nuevos flujos, ya que el primer paquete de cualquier flujo nuevo se utilizará para configurar la caché de flujos para procesar rápido la ruta de acceso. Es recomendable aumentar el tamaño del dispositivo de Edge o aumentar el número de nodos de Edge utilizados para las puertas de enlace activas/activas. |
3.2.2 |
Eventos de protección de endpoints
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Estado de EAM inactivo | Crítico | manager | El servicio ESX Agent Manager (EAM) en el administrador de equipos está inactivo. |
Inicie el servicio ESX Agent Manager (EAM). Utilice SSH en vCenter e invoque el comando service vmware-eam start. |
3.0.0 |
Canal de partners inactivo | Crítico | esx | La conexión de la SVM de partners y el módulo de host está inactiva. |
Consulte el artículo https://kb.vmware.com/s/article/85844 y asegúrese de que la SVM de partners {id_entidad} se vuelva a conectar al módulo de host. |
3.0.0 |
Eventos de Federation
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
BGP de RTEP inactivo | Alto | edge, autonomous-edge, public-cloud-gateway | Vecino BGP de RTEP inactivo. |
1. Invoque el comando de la CLI de NSX get logical-routers en el nodo de Edge afectado. |
3.0.1 |
Advertencia de sincronización de LM a LM | Mediano | manager | Se produjo un error en la sincronización entre ubicaciones remotas durante más de 3 minutos. |
1. Invoque el comando de la CLI de NSX get site-replicator remote-sites para obtener el estado de conexión entre las ubicaciones remotas. Si una ubicación remota está conectada, pero no sincronizada, es posible que la ubicación aún esté en proceso de resolución principal. En este caso, espere unos 10 segundos e intente invocar de nuevo la CLI para comprobar el estado de la ubicación remota. Si una ubicación está desconectada, intente realizar el siguiente paso. |
3.0.1 |
Error de sincronización de LM a LM | Alto | manager | Se produjo un error en la sincronización entre ubicaciones remotas durante más de 15 minutos. |
1. Invoque el comando de la CLI de NSX get site-replicator remote-sites para obtener el estado de conexión entre las ubicaciones remotas. Si una ubicación remota está conectada, pero no sincronizada, es posible que la ubicación aún esté en proceso de resolución principal. En este caso, espere unos 10 segundos e intente invocar de nuevo la CLI para comprobar el estado de la ubicación remota. Si una ubicación está desconectada, intente realizar el siguiente paso. |
3.0.1 |
Se perdió la conectividad de RTEP | Alto | manager | Se perdió la conectividad de ubicación de RTEP. |
1. Invoque el comando de la CLI de NSX get logical-routers en el nodo de Edge afectado {nombre_nodo_transporte}. |
3.0.2 |
Cerebro dividido de GM a GM | Crítico | global-manager | Varios nodos de Global Manager están activos al mismo tiempo. |
Configure solo un nodo de Global Manager como activo y los demás nodos de Global Manager como en espera. |
3.1.0 |
Advertencia de latencia de GM a GM | Mediano | global-manager | La latencia entre Global Managers es superior a la esperada durante más de 2 minutos |
Compruebe la conectividad entre el Global Manager {ruta_gm_origen}({id_sitio}) y el Global Manager {ruta_gm_destino}({id_sitio_remoto}) haciendo ping. Si no se puede hacer ping, compruebe si la conectividad WAN es inestable. |
3.2.0 |
Advertencia de sincronización de GM a GM | Mediano | global-manager | El Global Manager activo y el Global Manager en espera no se pueden sincronizar |
Compruebe la conectividad entre el Global Manager {ruta_gm_origen}({id_sitio}) y el Global Manager {ruta_gm_destino}({id_sitio_remoto}) haciendo ping. |
3.2.0 |
Error de sincronización de GM a GM | Alto | global-manager | El Global Manager activo no se puede sincronizar con el Global Manager en espera durante más de 5 minutos |
Compruebe la conectividad entre el Global Manager {ruta_gm_origen}({id_sitio}) y el Global Manager {ruta_gm_destino}({id_sitio_remoto}) haciendo ping. |
3.2.0 |
Advertencia de sincronización de GM a LM | Mediano | global-manager, manager | La sincronización de datos entre Global Manager (GM) y Local Manager (LM) ha fallado. |
1. Compruebe la conectividad de red entre el sitio remoto y el sitio local haciendo ping. |
3.2.0 |
Error de sincronización de GM a LM | Alto | global-manager, manager | La sincronización de datos entre Global Manager (GM) y Local Manager (LM) ha fallado durante un período prolongado. |
1. Compruebe la conectividad de red entre el sitio remoto y el sitio local haciendo ping. |
3.2.0 |
Umbral de ocupación de cola superado | Mediano | manager, global-manager | El umbral de tamaño de ocupación de la cola superó la advertencia. |
El tamaño de la cola puede superar el umbral debido a un problema de comunicación con el sitio remoto o un sistema sobrecargado. Compruebe el rendimiento del sistema y /var/log/async-replicator/ar.log para ver si hay algún error notificado. |
3.2.0 |
Advertencia de latencia de GM a LM | Mediano | global-manager, manager | La latencia entre Global Manager y Local Manager es superior a la esperada durante más de 2 minutos |
1. Compruebe la conectividad de red entre el sitio remoto y el sitio local haciendo ping. |
3.2.0 |
Restauración de LM mientras la importación de la configuración está en curso | Alto | global-manager | El Local Manager se restaura mientras la importación de la configuración está en curso en Global Manager. |
1. Inicie sesión en la CLI de NSX del dispositivo de Global Manager. |
3.2.0 |
Eventos de firewall de puerta de enlace
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Número de flujos de IP alto | Mediano | edge, public-cloud-gateway | El uso en la tabla de flujos del firewall de puerta de enlace para el tráfico IP es alto. El firewall de puerta de enlace descartará los nuevos flujos cuando el uso alcance el límite máximo. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> interface stats | json usando el UUID de interfaz correcto, y compruebe el uso de los flujos IP en la tabla de flujos. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de DOS ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, aumente el umbral de alarma o enrute el tráfico nuevo a otro nodo de Edge. |
3.1.3 |
Número de flujos de IP excedido | Crítico | edge, public-cloud-gateway | La tabla de flujos del firewall de puerta de enlace para el tráfico IP superó el umbral establecido. El firewall de puerta de enlace descartará los nuevos flujos cuando el uso alcance el límite máximo. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> interface stats | json usando el UUID de interfaz correcto, y compruebe el uso de los flujos IP en la tabla de flujos. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de DOS ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, aumente el umbral de alarma o enrute el tráfico nuevo a otro nodo de Edge. |
3.1.3 |
Número alto de flujos de UDP | Mediano | edge, public-cloud-gateway | El uso en la tabla de flujos del firewall de puerta de enlace para el tráfico UDP es alto. El firewall de puerta de enlace descartará los nuevos flujos cuando el uso alcance el límite máximo. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> interface stats | json usando el UUID de interfaz correcto, y compruebe el uso de los flujos UDP en la tabla de flujos. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de DOS ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, aumente el umbral de alarma o enrute el tráfico nuevo a otro nodo de Edge. |
3.1.3 |
Se superó el número de flujos de UDP | Crítico | edge, public-cloud-gateway | La tabla de flujos del firewall de puerta de enlace para el tráfico UDP superó el umbral establecido. El firewall de puerta de enlace descartará los nuevos flujos cuando el uso alcance el límite máximo. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> interface stats | json usando el UUID de interfaz correcto, y compruebe el uso de los flujos UDP en la tabla de flujos. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de DOS ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, aumente el umbral de alarma o enrute el tráfico nuevo a otro nodo de Edge. |
3.1.3 |
Número de flujos ICMP alto | Mediano | edge, public-cloud-gateway | El uso en la tabla de flujos del firewall de puerta de enlace para el tráfico ICMP es alto. El firewall de puerta de enlace descartará los nuevos flujos cuando el uso alcance el límite máximo. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> interface stats | json usando el UUID de interfaz correcto, y compruebe el uso de los flujos ICMP en la tabla de flujos. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de DOS ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, aumente el umbral de alarma o enrute el tráfico nuevo a otro nodo de Edge. |
3.1.3 |
Número de flujos ICMP superado | Crítico | edge, public-cloud-gateway | La tabla de flujos del firewall de puerta de enlace para el tráfico ICMP superó el umbral establecido. El firewall de puerta de enlace descartará los nuevos flujos cuando el uso alcance el límite máximo. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> interface stats | json usando el UUID de interfaz correcto, y compruebe el uso de los flujos ICMP en la tabla de flujos. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de DOS ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, aumente el umbral de alarma o enrute el tráfico nuevo a otro nodo de Edge. |
3.1.3 |
Número alto de flujos medio abiertos de TCP | Mediano | edge, public-cloud-gateway | El uso en la tabla de flujos del firewall de puerta de enlace para el tráfico medio abierto de TCP es alto. El firewall de puerta de enlace descartará los nuevos flujos cuando el uso alcance el límite máximo. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> interface stats | json indicando el UUID de interfaz correcto y compruebe en la tabla de flujos el uso del flujo medio abierto de TCP. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de DOS ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, aumente el umbral de alarma o enrute el tráfico nuevo a otro nodo de Edge. |
3.1.3 |
Se superó el número de flujos medio abiertos de TCP | Crítico | edge, public-cloud-gateway | La tabla de flujos del firewall de puerta de enlace para el tráfico medio abierto de TCP superó el umbral establecido. El firewall de puerta de enlace descartará los nuevos flujos cuando el uso alcance el límite máximo. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> interface stats | json indicando el UUID de interfaz correcto y compruebe en la tabla de flujos el uso de los flujos medio abiertos de TCP. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de DOS ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, aumente el umbral de alarma o enrute el tráfico nuevo a otro nodo de Edge. |
3.1.3 |
Eventos de grupo
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Se superó el límite de tamaño de grupo | Mediano | manager | El número total de elementos de grupo traducidos superó el límite máximo. |
1. Considere la posibilidad de ajustar los elementos del grupo sobredimensionado {id_grupo}. |
4.1.0 |
Eventos de alta disponibilidad
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Conmutación por error de puerta de enlace de nivel 0 | Alto | edge, autonomous-edge, public-cloud-gateway | Una puerta de enlace de nivel 0 conmutó por error. |
Invoque el comando de la CLI de NSX get logical-router <id_enrutador_servicio> para identificar el identificador vrf de enrutadores de servicio de nivel 0. Cambie al contexto de VRF invocando vrf <id-vrf> y, a continuación, invoque get high-availability status para determinar qué servicio está inactivo. |
3.0.0 |
Conmutación por error de puerta de enlace de nivel 1 | Alto | edge, autonomous-edge, public-cloud-gateway | Una puerta de enlace de nivel 1 conmutó por error. |
Invoque el comando de la CLI de NSX get logical-router <id_enrutador_servicio> para identificar el identificador vrf de enrutadores de servicio de nivel 1. Cambie al contexto de VRF invocando vrf <id-vrf> y, a continuación, invoque get high-availability status para determinar qué servicio está inactivo. |
3.0.0 |
Conmutación por error del grupo de servicios de nivel 0 | Alto | edge, public-cloud-gateway | El grupo de servicios no tiene una instancia activa. |
Invoque el comando de la CLI de NSX get logical-router <id_enrutador_servicio> service_group para comprobar todos los grupos de servicios configurados en un enrutador de servicio determinado. Examine la salida para ver el motivo por el que un grupo de servicios deja de tener el estado activo. |
4.0.1 |
Conmutación por error del grupo de servicios de nivel 1 | Alto | edge, public-cloud-gateway | El grupo de servicios no tiene una instancia activa. |
Invoque el comando de la CLI de NSX get logical-router <id_enrutador_servicio> service_group para comprobar todos los grupos de servicios configurados en un enrutador de servicio determinado. Examine la salida para ver el motivo por el que un grupo de servicios deja de tener el estado activo. |
4.0.1 |
Redundancia reducida del grupo de servicios de nivel 0 | Mediano | edge, public-cloud-gateway | Se produjo un error en una instancia en espera en un grupo de servicios. |
Invoque el comando de la CLI de NSX get logical-router <id_enrutador_servicio> service_group para comprobar todos los grupos de servicios configurados en un enrutador de servicio determinado. Examine el resultado para ver el motivo del error de un grupo de servicios en espera. |
4.0.1 |
Redundancia reducida del grupo de servicios de nivel 1 | Mediano | edge, public-cloud-gateway | Se produjo un error en una instancia en espera en un grupo de servicios. |
Invoque el comando de la CLI de NSX get logical-router <id_enrutador_servicio> service_group para comprobar todos los grupos de servicios configurados en un enrutador de servicio determinado. Examine el resultado para ver el motivo del error de un grupo de servicios en espera. |
4.0.1 |
Eventos del firewall de identidad
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Se perdió la conectividad con el servidor LDAP | Crítico | manager | Se perdió la conectividad con el servidor LDAP. |
Compruebe lo siguiente: |
3.1.0 |
Error en la sincronización Delta | Crítico | manager | Se produjeron errores al realizar la sincronización Delta. |
1. Compruebe si hay alguna alarma Se perdió la conectividad con el servidor LDAP. |
3.1.0 |
Eventos de comunicación de infraestructura
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Túneles de Edge inactivos | Crítico | edge, public-cloud-gateway | El estado del túnel de un nodo de Edge es inactivo. |
Invoque el comando de la CLI de NSX get tunnel-ports para obtener todos los puertos del túnel y, a continuación, compruebe cada una de las estadísticas del túnel invocando el comando de la CLI de NSX get tunnel-port <UUID> stats para comprobar si hay alguna pérdida de conexión. Además, compruebe si en /var/log/syslog hay errores relacionados con el túnel. |
3.0.0 |
Eventos del servicio de infraestructura
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Estado del servicio desconocido en DPU | Crítico | dpu | El estado del servicio en la DPU es anómalo. |
Compruebe que el servicio {nombre_servicio} en la DPU {id_dpu} sigue en ejecución invocando /etc/init.d/{nombre_servicio} status. Si se indica que el servicio está en ejecución, es posible que tenga que reiniciarlo, lo que puede hacer ejecutando /etc/init.d/{nombre_servicio} restart. Vuelva a ejecutar el comando de estado para verificar que el servicio se está ejecutando. Si el reinicio del servicio no resuelve el problema o si el problema vuelve a ocurrir después de un reinicio correcto, póngase en contacto con el equipo de soporte técnico de VMware. |
4.0.0 |
Estado de servicio desconocido | Crítico | esx, kvm, bms, edge, manager, public-cloud-gateway, global-manager | El estado del servicio es anormal. |
Compruebe que el servicio {nombre_servicio} sigue en ejecución invocando /etc/init.d/{nombre_servicio} status. Si se indica que el servicio está en ejecución, es posible que tenga que reiniciarlo, lo que puede hacer ejecutando /etc/init.d/{nombre_servicio} restart. Vuelva a ejecutar el comando de estado para verificar que el servicio se está ejecutando. Si el script /etc/init.d/{nombre_servicio} no está disponible, invoque systemctl {nombre_servicio} status y reinicie mediante systemctl {nombre_servicio} restart con privilegios de usuario root. Si el reinicio del servicio no resuelve el problema o si el problema vuelve a ocurrir después de un reinicio correcto, póngase en contacto con el equipo de soporte técnico de VMware. |
3.1.0 |
Error de entrega de métricas | Crítico | esx, bms, edge, manager, public-cloud-gateway, global-manager | No se pudieron enviar métricas al destino especificado. |
El usuario debe realizar las siguientes comprobaciones para excluir el problema que provoca el error: 1. Compruebe si la dirección de destino {dirección_destino_métricas} y el puerto {puerto_destino_métricas} (el valor predeterminado es 443 en el caso de que no se especifique el puerto) se transmitieron para conectarse es el destino esperado. 2. Compruebe si el certificado es correcto mediante /opt/vmware/nsx-nestdb/bin/nestdb-cli --cmd 'put vmware.nsx.nestdb.CommonAgentHostConfigMsg'. 3. Compruebe si se puede acceder al destino {dirección_destino_métricas}. 4. Compruebe si el administrador de métricas en el destino {dirección_destino_métricas} se está ejecutando mediante docker ps | grep metrics_manager. 5. Comprueba si el puerto {puerto_destino_métricas} está abierto mediante netstat -a | grep {puerto_destino_métricas} en el destino. 6. Compruebe si la regla de firewall ALLOW está instalada en el nodo mediante iptables -S OUTPUT | grep {puerto_destino_métricas}(EDGE/UA) o localcli network firewall ruleset list | grep nsx-sha-tsdb(ESX). 7. Reinicie el daemon SHA para ver si se puede resolver mediante /etc/init.d/netopa restart(ESX), /etc/init.d/nsx-netopa restart(EDGE) o /etc/init.d/nsx-sha restart(UA). |
4.1.0 |
Estado de servicio de Edge inactivo | Crítico | edge, autonomous-edge, public-cloud-gateway | El servicio de Edge está inactivo durante al menos un minuto. |
En el nodo de Edge, compruebe que el servicio no haya finalizado debido a un error buscando archivos de núcleo en el directorio /var/log/core. Además, invoque el comando de la CLI de NSX get services para confirmar si el servicio se detuvo. Si es así, invoque start service <nombre-servicio> para reiniciar el servicio. |
3.0.0 |
Estado del servicio de Edge cambiado | Mediano | edge, autonomous-edge, public-cloud-gateway | El estado del servicio de Edge cambió. |
En el nodo de Edge, compruebe que el servicio no haya finalizado debido a un error buscando archivos de núcleo en el directorio /var/log/core. Además, invoque el comando de la CLI de NSX get services para confirmar si el servicio se detuvo. Si es así, invoque start service <nombre-servicio> para reiniciar el servicio. |
3.0.0 |
Aplicación bloqueada | Crítico | global-manager, autonomous-edge, bms, edge, esx, kvm, manager, public-cloud-gateway | La aplicación se bloqueó y generó un volcado de núcleo. |
Recopile el paquete de soporte para el nodo de NSX {nombre_host_o_visual_nodo} usando la API o la interfaz de usuario de NSX Manager. Tenga en cuenta que los volcados de núcleo se pueden configurar para mover o copiar en el paquete de soporte de NSX Tech con el fin de eliminar o conservar la copia local en el nodo. La copia del paquete de soporte con archivos de volcado de núcleo es esencial para que el equipo de soporte de VMware pueda solucionar el problema y se recomienda guardar una copia más reciente del paquete de soporte técnico, incluidos los archivos de volcado de núcleo, antes de eliminar los archivos de volcado de núcleo del sistema. Consulte el artículo de la base de conocimientos para obtener más información. |
4.0.0 |
Eventos de comunicación de Intelligence
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
El exportador de flujo de TN se desconectó | Alto | esx, kvm, bms | Un nodo de transporte está desconectado del agente de mensajería de su nodo de Intelligence. La recopilación de datos se ve afectada. |
Reinicie el servicio de mensajería si no se está ejecutando en el nodo de Intelligence. Resuelva el error de conexión de red entre el exportador de flujo del nodo de transporte y el nodo de Intelligence. |
3.0.0 |
Eventos de estado de Intelligence
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Uso de CPU muy alto | Crítico | manager, intelligence | El uso de la CPU del nodo de Intelligence es muy alto. |
Utilice el comando top para comprobar qué procesos utilizan más la CPU y, a continuación, revise /var/log/syslog y los registros locales de estos procesos para comprobar si hay errores pendientes que resolver. |
3.0.0 |
Uso de CPU alto | Mediano | manager, intelligence | El uso de la CPU del nodo de Intelligence es alto. |
Utilice el comando top para comprobar qué procesos utilizan más la CPU y, a continuación, revise /var/log/syslog y los registros locales de estos procesos para comprobar si hay errores pendientes que resolver. |
3.0.0 |
Uso de memoria muy alto | Crítico | manager, intelligence | El uso de la memoria del nodo de Intelligence es muy alto. |
Utilice el comando top para comprobar qué procesos utilizan más memoria y, a continuación, revise /var/log/syslog y los registros locales de estos procesos para comprobar si hay errores pendientes que resolver. |
3.0.0 |
Uso de memoria alto | Mediano | manager, intelligence | El uso de la memoria del nodo de Intelligence es alto. |
Utilice el comando top para comprobar qué procesos utilizan más memoria y, a continuación, revise /var/log/syslog y los registros locales de estos procesos para comprobar si hay errores pendientes que resolver. |
3.0.0 |
Uso de disco muy alto | Crítico | manager, intelligence | El uso del disco del nodo de Intelligence es muy alto. |
Examine la partición de disco {nombre_partición_disco} y compruebe si hay archivos inesperadamente grandes que se puedan eliminar. |
3.0.0 |
Uso de disco alto | Mediano | manager, intelligence | El uso del disco del nodo de Intelligence es alto. |
Examine la partición de disco {nombre_partición_disco} y compruebe si hay archivos inesperadamente grandes que se puedan eliminar. |
3.0.0 |
Uso de partición de disco de datos muy alto | Crítico | manager, intelligence | El uso de la partición del disco de datos del nodo de Intelligence es muy alto. |
Detenga la recopilación de datos de NSX intelligence hasta que el uso del disco esté por debajo del umbral. En la interfaz de usuario de NSX, vaya a Sistema | Dispositivos | Dispositivo de NSX Intelligence. A continuación, haga clic en ACCIONES, Detener la recopilación de datos. |
3.0.0 |
Uso de partición de disco de datos alto | Mediano | manager, intelligence | El uso de la partición del disco de datos del nodo de Intelligence es alto. |
Detenga la recopilación de datos de NSX intelligence hasta que el uso del disco esté por debajo del umbral. Examine la partición de disco /data y compruebe si hay archivos inesperadamente grandes que se puedan eliminar. |
3.0.0 |
Latencia de almacenamiento alta | Mediano | manager, intelligence | La latencia de almacenamiento del nodo de Intelligence es alta. |
Es posible que se produzca una latencia de almacenamiento elevada transitoria debido a un pico de solicitudes de E/S. Si la latencia de almacenamiento permanece alta durante más de 30 minutos, considere la posibilidad de implementar el dispositivo de NSX Intelligence en un disco de baja latencia o de no compartir el mismo dispositivo de almacenamiento con otras máquinas virtuales. |
3.1.0 |
Estado de nodo degradado | Alto | manager, intelligence | El estado del nodo de Intelligence se degradó. |
Invoque la NSX API GET /napp/api/v1/platform/monitor/category/health para comprobar qué pod específico está inactivo y por qué. Invoque el siguiente comando de la CLI para reiniciar el servicio degradado: kubectl rollout restart <statefulset/deployment> <nombre_servicio> -n &espacio_de_nombres> |
3.0.0 |
Eventos de IPAM
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Uso de bloque de IP muy alto | Mediano | manager | El uso del bloque de direcciones IP es muy alto. |
Revise el uso de bloques de direcciones IP. Utilice un nuevo bloque de direcciones IP para crear recursos o elimine la subred de IP no utilizada del bloque de direcciones IP. Para comprobar la subred que se utiliza para el bloque de direcciones IP, haga lo siguiente. En la interfaz de usuario de NSX, desplácese hasta Redes | Grupos de direcciones IP | Pestaña Grupos de direcciones IP. Seleccione los grupos de direcciones IP en los que se utiliza el bloque de direcciones IP y consulte Subredes y la columna Direcciones IP asignadas en la interfaz de usuario. Si no se ha utilizado ninguna asignación para el grupo de direcciones IP y no se va a utilizar en el futuro, elimine la subred o el grupo de direcciones IP. Utilice la siguiente API para comprobar si el bloque de direcciones IP está siendo utilizado por el grupo de direcciones IP, y también si se ha realizado alguna asignación de IP: Para obtener las subredes configuradas de un grupo de direcciones IP, invoque la NSX API GET /policy/api/v1/infra/ip-pools/<grupo-ip>/ip-subnets. Para obtener asignaciones de IP, invoque la NSX API GET /policy/api/v1/infra/ip-pools/<grupo-ip>/ip-allocations. Nota: Solo se debe eliminar el grupo de direcciones IP o la subred si no tiene ninguna dirección IP asignada y no se va a utilizar en el futuro. |
3.1.2 |
Uso de grupo de IP muy alto | Mediano | manager | El uso del grupo de direcciones IP es muy alto. |
Revise el uso del grupo de direcciones IP. Libere asignaciones de IP no utilizadas del grupo de direcciones IP o cree un nuevo grupo de direcciones IP y úselo. En la interfaz de usuario de NSX, desplácese hasta Redes | Grupos de direcciones IP | Pestaña Grupos de direcciones IP. Seleccione los grupos de direcciones IP y consulte la columna Direcciones IP asignadas. Se mostrarán las direcciones IP asignadas desde el grupo de direcciones IP. Si el usuario ve que alguna dirección IP no se está utilizando, pueden liberarla. Para liberar asignaciones de IP no utilizadas, invoque la NSX API DELETE /policy/api/v1/infra/ip-pools/<grupo-ip>/ip-allocations/<ip-allocation> |
3.1.2 |
Eventos de licencias
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Licencia caducada | Crítico | global-manager, manager | Una licencia caducó. |
Para agregar una licencia nueva no caducada mediante la interfaz de usuario de NSX, vaya a Sistema | Licencias y, a continuación, haga clic en AGREGAR y especifique la clave de la nueva licencia. Debe eliminar la licencia caducada marcando la casilla de verificación de la licencia y haciendo clic en ELIMINAR. |
3.0.0 |
La licencia está a punto de caducar | Mediano | global-manager, manager | Una licencia está a punto de caducar. |
La licencia caducará dentro de unos días. Debe agregar una licencia nueva que no esté a punto de caducar mediante la interfaz de usuario de NSX. Vaya a Sistema | Licencias y, a continuación, haga clic en AGREGAR y especifique la clave de la nueva licencia. Debe eliminar la licencia caducada marcando la casilla de verificación de la licencia y haciendo clic en ELIMINAR. |
3.0.0 |
Eventos de equilibrador de carga
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
CPU de LB muy alta | Mediano | Edge | El uso de la CPU del equilibrador de carga es muy alto. |
Si el uso de CPU del equilibrador de carga es superior al umbral de uso del sistema, la carga de trabajo será demasiado alta para este equilibrador de carga. Cambie la escala del servicio del equilibrador de carga cambiando el tamaño del equilibrador de carga de pequeño a mediano o de mediano a grande. Si el uso de la CPU de este equilibrador de carga sigue siendo alto, es recomendable ajustar el tamaño del factor de forma del dispositivo Edge o mover los servicios del equilibrador de carga a otros nodos de Edge según la carga de trabajo correspondiente. |
3.0.0 |
Estado de LB degradado | Mediano | manager | El servicio del equilibrador de carga está degradado. |
Para el equilibrador de carga centralizado: compruebe el estado del equilibrador de carga en el nodo de Edge en espera, ya que el estado degradado significa que el estado del equilibrador de carga en el nodo de Edge en espera no está listo. En el nodo de Edge en espera, invoque el comando de la CLI de NSX get load-balancer <uuid-lb> status. Si el estado del servicio de equilibrado de carga es not_ready o no hay ningún resultado, haga que el nodo de Edge entre en modo de mantenimiento y, a continuación, salga del modo de mantenimiento. Para el equilibrador de carga distribuido: |
3.1.2 |
Estado de DLB inactivo | Crítico | manager | El servicio del equilibrador de carga distribuido está inactivo. |
En el nodo de host ESXi, invoque el comando de la CLI de NSX `get load-balancer <uuid-lb> status`. Si se indica ''Conflict LSP'', compruebe si este LSP está conectado a otro servicio de equilibrador de carga. Compruebe si este conflicto es aceptable. Si se muestra el mensaje de ''Not Ready LSP'', compruebe el estado de este LSP invocando el comando de la CLI de NSX get logical-switch-port status. |
3.1.2 |
Estado de LB inactivo | Crítico | Edge | El servicio del equilibrador de carga centralizado está inactivo. |
En el nodo de Edge activo, compruebe el estado del equilibrador de carga invocando el comando de la CLI de NSX get load-balancer <uuid-lb> status. Si el estado del servicio de equilibrado de carga es not_ready o no hay ningún resultado, haga que el nodo de Edge entre en modo de mantenimiento y, a continuación, salga del modo de mantenimiento. |
3.0.0 |
Estado de servidor virtual inactivo | Mediano | Edge | El servicio virtual del equilibrador de carga está inactivo. |
Consulte el grupo de equilibradores de carga para determinar su estado y comprobar su configuración. Si está configurado de forma incorrecta, vuelva a configurarlo, quite el grupo de equilibradores de carga del servidor virtual y vuelva a agregarlo al servidor virtual. |
3.0.0 |
Estado de grupo inactivo | Mediano | Edge | El grupo del equilibrador de carga está inactivo. |
Consulte el grupo de equilibradores de carga para determinar qué miembros están inactivos invocando el comando de la CLI de NSX get load-balancer <lb-uuid> pool <pool-uuid> status o la NSX API GET /policy/api/v1/infra/lb-services/<id-servicio-lb>/lb-pools/<id-grupo-lb>/detailed-status. Si se notifica INACTIVO o DESCONOCIDO, compruebe el miembro del grupo. Compruebe la conectividad de red desde el equilibrador de carga hasta los miembros del grupo afectados. Valide el estado de la aplicación de cada miembro del grupo. Valide también el estado de cada miembro del grupo mediante el monitor configurado. Cuando se establece el buen estado del miembro, el estado del miembro del grupo se actualizará a correcto según la configuración de 'Recuento de subida' en el monitor. Para corregir el problema, reinicie el miembro del grupo o haga que el nodo de Edge entre en modo de mantenimiento y, a continuación, salga del modo de mantenimiento. |
3.0.0 |
Capacidad de Edge de LB en uso alto | Mediano | Edge | El uso del equilibrador de carga es alto. |
Si se configuraron varias instancias de LB en este nodo de Edge, implemente un nuevo nodo de Edge y mueva algunas instancias de LB al nuevo nodo de Edge. Si solo se configuró una instancia de LB (pequeña/mediana/etc.) en un nodo de Edge de mismo tamaño (pequeño/mediano/etc.), implemente una nueva instancia de Edge de mayor tamaño y mueva la instancia de LB a ese nuevo nodo de Edge. |
3.1.2 |
Capacidad de miembro de grupo de LB en uso muy alto | Crítico | Edge | El uso del miembro del grupo del equilibrador de carga es muy alto. |
Implemente un nuevo nodo de Edge y mueva el servicio de equilibrador de carga de los nodos de Edge existentes al nodo de Edge recién implementado. |
3.1.2 |
No se realizó la configuración del equilibrio de carga debido a falta de memoria | Mediano | Edge | La configuración del equilibrador de carga no se realiza debido al uso elevado de memoria en el nodo de Edge. |
Preferir definir equilibradores de carga pequeños y medianos en lugar de equilibradores de carga de gran tamaño. Distribuya los servicios del equilibrador de carga entre los nodos de Edge disponibles. Reduzca la cantidad de servidores virtuales definidos. |
3.2.0 |
Eventos de estado de prevención de malware
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Estado del servicio inactivo | Alto | manager | El estado del servicio es inactivo. |
1. En el nodo de Edge identificado por {nombre_nt_edge_nsx}, invoque la CLI de NSX get services para comprobar el estado de {nombre_servicio_mps}. Inspeccione /var/log/syslog para encontrar cualquier error sospechoso. |
4.0.1 |
Servicio de extracción de archivos inaccesible | Alto | manager | El estado del servicio es degradado. |
1. En el nodo de Edge identificado por {nombre_nt_edge_nsx}, invoque la CLI de NSX get ids engine status para comprobar el estado del servicio de file_extraction (IDS). Inspeccione /var/log/syslog para encontrar cualquier error sospechoso con el servicio de extracción de archivos (IDS) o {nombre_servicio_mps}. |
4.0.1 |
Base de datos inaccesible | Alto | manager | El estado del servicio es degradado. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales para comprobar qué servicio está degradado. Invoque la NSX API GET /napp/api/v1/platform/monitor/feature/health para comprobar qué servicio específico está inactivo y por qué. Invoque el siguiente comando de la CLI para reiniciar el servicio degradado: kubectl rollout restart <statefulset/deployment> <nombre_servicio> -n <espacio_de_nombres>. Determine el estado del servicio Malware Prevention Database. |
4.0.1 |
Servicio de API de analista inaccesible | Alto | manager | El estado del servicio es degradado. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales para comprobar qué servicio está degradado. Invoque la NSX API GET /napp/api/v1/platform/monitor/feature/health para comprobar qué servicio específico está inactivo y por qué. Invoque el siguiente comando de la CLI para reiniciar el servicio degradado: kubectl rollout restart <statefulset/deployment> <nombre_servicio> -n <espacio_de_nombres>. Determine el estado del servicio Malware Prevention Cloud Connector. |
4.0.1 |
No se puede acceder al servicio de reputación de NTICS | Alto | manager | El estado del servicio es degradado. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales para comprobar qué servicio está degradado. Invoque la NSX API GET /napp/api/v1/platform/monitor/feature/health para comprobar qué servicio específico está inactivo y por qué. Invoque el siguiente comando de la CLI para reiniciar el servicio degradado: kubectl rollout restart <statefulset/deployment> <nombre_servicio> -n <espacio_de_nombres>. Determina si el acceso al servicio NTICS está inactivo. |
4.1.0 |
Eventos de estado de Manager
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Uso de la CPU de Manager muy alto | Crítico | global-manager, manager | El uso de la CPU del nodo de Manager es muy alto. |
Revise la configuración, los servicios en ejecución y el tamaño de este nodo de Manager. Es recomendable ajustar el tamaño del factor de forma del dispositivo de Manager. |
3.0.0 |
Uso de la CPU de Manager alto | Mediano | global-manager, manager | El uso de la CPU del nodo de Manager es alto. |
Revise la configuración, los servicios en ejecución y el tamaño de este nodo de Manager. Es recomendable ajustar el tamaño del factor de forma del dispositivo de Manager. |
3.0.0 |
Uso de la memoria de Manager muy alto | Crítico | global-manager, manager | El uso de la memoria del nodo de Manager es muy alto. |
Revise la configuración, los servicios en ejecución y el tamaño de este nodo de Manager. Es recomendable ajustar el tamaño del factor de forma del dispositivo de Manager. |
3.0.0 |
Uso de la memoria de Manager alto | Mediano | global-manager, manager | El uso de la memoria del nodo de Manager es alto. |
Revise la configuración, los servicios en ejecución y el tamaño de este nodo de Manager. Es recomendable ajustar el tamaño del factor de forma del dispositivo de Manager. |
3.0.0 |
Uso del disco de Manager muy alto | Crítico | global-manager, manager | El uso del disco del nodo de Manager es muy alto. |
Examine la partición con un uso elevado y compruebe si hay archivos inesperadamente grandes que se puedan eliminar. |
3.0.0 |
Uso del disco de Manager alto | Mediano | global-manager, manager | El uso del disco del nodo de Manager es alto. |
Examine la partición con un uso elevado y compruebe si hay archivos inesperadamente grandes que se puedan eliminar. |
3.0.0 |
Uso del disco de configuración de Manager muy alto | Crítico | global-manager, manager | El uso del disco de configuración del nodo de Manager es muy alto. |
Ejecute la siguiente herramienta y póngase en contacto con GSS si se notifica algún problema: /opt/vmware/tools/support/inspect_checkpoint_issues.py |
3.0.0 |
Uso del disco de configuración de Manager alto | Mediano | global-manager, manager | El uso del disco de configuración del nodo de Manager es alto. |
Ejecute la siguiente herramienta y póngase en contacto con GSS si se notifica algún problema: /opt/vmware/tools/support/inspect_checkpoint_issues.py |
3.0.0 |
Uso de disco de base de datos de operaciones muy alto | Crítico | manager | El uso del disco nonconfig del nodo de Manager es muy alto. |
Ejecute la siguiente herramienta y póngase en contacto con GSS si se notifica algún problema: /opt/vmware/tools/support/inspect_checkpoint_issues.py --nonconfig |
3.0.1 |
Uso de disco de base de datos de operaciones alto | Mediano | manager | El uso del disco nonconfig del nodo de Manager es alto. |
Ejecute la siguiente herramienta y póngase en contacto con GSS si se notifica algún problema: /opt/vmware/tools/support/inspect_checkpoint_issues.py --nonconfig |
3.0.1 |
Dirección IP duplicada | Mediano | manager | Otro dispositivo está usando la dirección IP del nodo de Manager. |
1. Determine qué dispositivo está usando la dirección IP del administrador y asígnele una nueva dirección IP. Tenga en cuenta que no se admite la reconfiguración de Manager para utilizar una nueva dirección IP. |
3.0.0 |
Error de almacenamiento | Crítico | global-manager, manager | El disco del nodo de Manager es de solo lectura. |
Examine la partición de solo lectura para ver si el reinicio resuelve el problema o si se debe reemplazar el disco. Póngase en contacto con GSS para obtener más información. |
3.0.2 |
Falta una entrada de DNS para el FQDN de Manager | Crítico | global-manager, manager | Falta la entrada de DNS para el FQDN de Manager. |
1. Asegúrese de que los servidores DNS adecuados estén configurados en el nodo de Manager. |
4.1.0 |
Falta una entrada de DNS para el FQDN de Vip | Crítico | manager | Falta la entrada de FQDN para la VIP de Manager. |
Examine la entrada de DNS de las direcciones VIP para ver si se resuelven en el mismo FQDN. |
4.1.0 |
Eventos de comprobación de MTU
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Error de coincidencia de MTU dentro de la zona de transporte | Alto | manager | Error de coincidencia de la configuración de MTU entre nodos de transporte asociados a la misma zona de transporte. |
1. Desplácese a Sistema | Tejido | Configuración | Comprobación de configuración de MTU | Inconsistente en la interfaz de usuario de NSX para comprobar más detalles de discrepancias. |
3.2.0 |
La MTU del enrutador global es demasiado grande | Mediano | manager | La configuración de MTU del enrutador global es mayor que la MTU de la zona de transporte superpuesta. |
1. Desplácese a Sistema | Tejido | Configuración | Comprobación de configuración de MTU | Inconsistente en la interfaz de usuario de NSX para comprobar más detalles de discrepancias. |
3.2.0 |
Eventos de NAT
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
El uso del puerto SNAT en la puerta de enlace es alto | Crítico | edge, public-cloud-gateway | El uso del puerto SNAT en la puerta de enlace es alto. |
Inicie sesión como usuario admin en el nodo de Edge e invoque el comando de la CLI de NSX get firewall <LR_INT_UUID> connection state indicando el UUID de interfaz correcto y compruebe varias asignaciones SNAT para la IP de SNAT {dirección_ip_snat}. Compruebe que los flujos de tráfico que pasan por la puerta de enlace no son un ataque de denegación de servicio ni una ráfaga anómala. Si el tráfico parece estar dentro de la carga normal, pero se alcanza el umbral de alarma, agregue más direcciones IP de SNAT para distribuir la carga o enrute el tráfico nuevo a otro nodo de Edge. |
3.2.0 |
Eventos de estado de NCP
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Complemento NCP inactivo | Crítico | manager | El nodo de Manager detectó que NCP está inactivo o en mal estado. |
Para encontrar los clústeres que tienen problemas, utilice la interfaz de NSX y desplácese hasta la página Alarmas. El valor Nombre de entidad de esta instancia de alarma identifica el nombre del clúster. O bien, invoque la NSX API GET /api/v1/systemhealth/container-cluster/ncp/status para obtener todos los estados del clúster y determinar el nombre de los clústeres con estado DOWN o UNKNOWN. A continuación, en la página Inventario | Contenedor | Clústeres de la interfaz de usuario de NSX, busque el clúster por nombre y haga clic en la pestaña Nodos, donde se muestran todos los miembros del clúster de Kubernetes y PAS. Para el clúster de Kubernetes: |
3.0.0 |
Eventos de estado de los agentes de nodo evento
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Agentes de nodo inactivos en DPU | Alto | dpu | Parece que los agentes que se ejecutan en la máquina virtual del nodo están inactivos en la DPU. |
1. Si falta Vmk50 en la DPU {id_dpu}, consulte este artículo de la base de conocimientos https://kb.vmware.com/s/article/67432. |
4.0.0 |
Agentes de nodo inactivos | Alto | esx, kvm | Parece que los agentes que se ejecutan en la máquina virtual del nodo están inactivos. |
Para ESX: |
3.0.0 |
Eventos de comunicación de NSX Application Platform
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Manager desconectado | Alto | manager, intelligence | El clúster de NSX Application Platform está desconectado del clúster de administración de NSX. |
Compruebe si el certificado del clúster de Manager, los certificados del nodo de Manager, el certificado kafka y el certificado de entrada coinciden tanto en el clúster NSX Application Platform como en NSX Manager. Compruebe que las fechas de caducidad de los certificados mencionados anteriormente sean válidas. Compruebe la conexión de red entre NSX Manager y NSX Application Platform y resuelva cualquier error. |
3.2.0 |
Retraso detectado en Rawflow de Mensajería | Crítico | manager, intelligence | Se detectó un procesamiento de datos lento en el tema Raw Flow de Mensajería. |
Agregue nodos y, a continuación, escale verticalmente el clúster de NSX Application Platform. Si se puede atribuir un cuello de botella a un servicio específico, por ejemplo, el servicio de análisis, escale verticalmente el servicio específico cuando se agregan los nuevos nodos. |
3.2.0 |
Retraso detectado en Overflow de Mensajería | Crítico | manager, intelligence | Se detectó un procesamiento de datos lento en el tema Over Flow de Mensajería. |
Agregue nodos y, a continuación, escale verticalmente el clúster de NSX Application Platform. Si se puede atribuir un cuello de botella a un servicio específico, por ejemplo, el servicio de análisis, escale verticalmente el servicio específico cuando se agregan los nuevos nodos. |
3.2.0 |
El exportador de flujo de TN se desconectó | Alto | esx, kvm, bms | Un nodo de transporte está desconectado del agente de mensajería del clúster de NSX Application Platform. La recopilación de datos se ve afectada. |
Reinicie el servicio de mensajería si no se está ejecutando en el clúster de NSX Application Platform. Resuelva el error de conexión de red entre el exportador de flujo del nodo de transporte y el clúster de NSX Application Platform. |
3.2.0 |
El exportador de flujo de TN se desconectó en DPU | Alto | dpu | Un nodo de transporte está desconectado del agente de mensajería de su nodo de Intelligence. La recopilación de datos se ve afectada en DPU. |
Reinicie el servicio de mensajería si no se está ejecutando en el nodo de Intelligence. Resuelva el error de conexión de red entre el exportador de flujo del nodo de transporte y el nodo de Intelligence. |
4.0.0 |
Eventos de estado de NSX Application Platform
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Uso de CPU de clúster muy alto | Crítico | manager, intelligence | El uso de la CPU del clúster de NSX Application Platform es muy alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Carga del sistema en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si se requiere más potencia informática, haga clic en el botón Escalado horizontal para solicitar más recursos. |
3.2.0 |
Uso de CPU de clúster alto | Mediano | manager, intelligence | El uso de la CPU del clúster de NSX Application Platform es alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Carga del sistema en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si se requiere más potencia informática, haga clic en el botón Escalado horizontal para solicitar más recursos. |
3.2.0 |
Uso de memoria de clúster muy alto | Crítico | manager, intelligence | El uso de la memoria del clúster de NSX Application Platform es muy alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Memoria en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si se requiere más memoria, haga clic en el botón Escalado horizontal para solicitar más recursos. |
3.2.0 |
Uso de memoria de clúster alto | Mediano | manager, intelligence | El uso de la memoria del clúster de NSX Application Platform es alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Memoria en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si se requiere más memoria, haga clic en el botón Escalado horizontal para solicitar más recursos. |
3.2.0 |
Uso de disco de clúster muy alto | Crítico | manager, intelligence | El uso del disco del clúster de NSX Application Platform es muy alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Almacenamiento en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si se requiere más espacio de almacenamiento en el disco, haga clic en el botón Escalado horizontal para solicitar más recursos. Si el servicio de almacenamiento está bajo presión, otra solución es hacer clic en el botón Escalado vertical para aumentar el tamaño del disco. |
3.2.0 |
Uso de disco de clúster alto | Mediano | manager, intelligence | El uso del disco del clúster de NSX Application Platform es alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Almacenamiento en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si se requiere más espacio de almacenamiento en el disco, haga clic en el botón Escalado horizontal para solicitar más recursos. Si el servicio de almacenamiento está bajo presión, otra solución es hacer clic en el botón Escalado vertical para aumentar el tamaño del disco. |
3.2.0 |
Estado de NAPP degradado | Mediano | manager, intelligence | El estado general del clúster de NSX Application Platform es degradado. |
Obtenga más información de las alarmas de nodos y servicios. |
3.2.0 |
Estado de NAPP inactivo | Alto | manager, intelligence | El estado general del clúster de NSX Application Platform es inactivo. |
Obtenga más información de las alarmas de nodos y servicios. |
3.2.0 |
Uso de CPU de nodo muy alto | Crítico | manager, intelligence | El uso de la CPU del nodo de NSX Application Platform es muy alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Carga del sistema en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si solo una pequeña cantidad de nodos muestra un uso elevado de la CPU, Kubernetes volverá a programar los servicios automáticamente de forma predeterminada. Si la mayoría de los nodos muestra un uso elevado de la CPU y la carga no se puede reducir, haga clic en el botón Escalado horizontal para solicitar más recursos. |
3.2.0 |
Uso de CPU de nodo alto | Mediano | manager, intelligence | El uso de la CPU del nodo de NSX Application Platform es alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Carga del sistema en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si solo una pequeña cantidad de nodos muestra un uso elevado de la CPU, Kubernetes volverá a programar los servicios automáticamente de forma predeterminada. Si la mayoría de los nodos muestra un uso elevado de la CPU y la carga no se puede reducir, haga clic en el botón Escalado horizontal para solicitar más recursos. |
3.2.0 |
Uso de memoria de nodo muy alto | Crítico | manager, intelligence | El uso de la memoria del nodo de NSX Application Platform es muy alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Memoria en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si solo una pequeña cantidad de nodos muestra un uso elevado de la memoria, Kubernetes volverá a programar los servicios automáticamente de forma predeterminada. Si la mayoría de los nodos muestra un uso elevado de la memoria y la carga no se puede reducir, haga clic en el botón Escalado horizontal para solicitar más recursos. |
3.2.0 |
Uso de memoria de nodo alto | Mediano | manager, intelligence | El uso de la memoria del nodo de NSX Application Platform es alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Memoria en cada servicio para comprobar qué servicio está bajo presión. Compruebe si se puede reducir la carga. Si solo una pequeña cantidad de nodos muestra un uso elevado de la memoria, Kubernetes volverá a programar los servicios automáticamente de forma predeterminada. Si la mayoría de los nodos muestra un uso elevado de la memoria y la carga no se puede reducir, haga clic en el botón Escalado horizontal para solicitar más recursos. |
3.2.0 |
Uso de disco de nodo muy alto | Crítico | manager, intelligence | El uso del disco del nodo de NSX Application Platform es muy alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Almacenamiento en cada servicio para comprobar qué servicio está bajo presión. Borre los registros o datos no utilizados para liberar recursos de disco y compruebe si se puede reducir la carga. Si se requiere más espacio de almacenamiento en el disco, escale horizontalmente el servicio que está bajo presión. Si el servicio de almacenamiento está bajo presión, otra solución es hacer clic en el botón Escalado vertical para aumentar el tamaño del disco. |
3.2.0 |
Uso de disco de nodo alto | Mediano | manager, intelligence | El uso del disco del nodo de NSX Application Platform es alto. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales y compruebe el campo Almacenamiento en cada servicio para comprobar qué servicio está bajo presión. Borre los registros o datos no utilizados para liberar recursos de disco y compruebe si se puede reducir la carga. Si se requiere más espacio de almacenamiento en el disco, escale horizontalmente el servicio que está bajo presión. Si el servicio de almacenamiento está bajo presión, otra solución es hacer clic en el botón Escalado vertical para aumentar el tamaño del disco. |
3.2.0 |
Estado de nodo degradado | Mediano | manager, intelligence | El estado del nodo de NSX Application Platform es degradado. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Recursos para comprobar qué nodo se degradó. Compruebe el uso de red, memoria y CPU del nodo. Reinicie el nodo si es un nodo de trabajo. |
3.2.0 |
Estado de nodo inactivo | Alto | manager, intelligence | El estado del nodo de NSX Application Platform es inactivo. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Recursos para comprobar qué nodo está inactivo. Compruebe el uso de red, memoria y CPU del nodo. Reinicie el nodo si es un nodo de trabajo. |
3.2.0 |
Uso de CPU de almacén de datos muy alto | Crítico | manager, intelligence | El uso de la CPU del servicio Almacenamiento de datos es muy alto. |
Escale horizontalmente todos los servicios o el servicio Almacenamiento de datos. |
3.2.0 |
Uso de CPU de almacén de datos alto | Mediano | manager, intelligence | El uso de la CPU del servicio Almacenamiento de datos es alto. |
Escale horizontalmente todos los servicios o el servicio Almacenamiento de datos. |
3.2.0 |
Uso de CPU de Mensajería muy alto | Crítico | manager, intelligence | El uso de la CPU del servicio Mensajería es muy alto. |
Escale horizontalmente todos los servicios o el servicio Mensajería. |
3.2.0 |
Uso de CPU de Mensajería alto | Mediano | manager, intelligence | El uso de la CPU del servicio Mensajería es alto. |
Escale horizontalmente todos los servicios o el servicio Mensajería. |
3.2.0 |
Uso de CPU de base de datos de configuración muy alto | Crítico | manager, intelligence | El uso de la CPU del servicio Base de datos de configuración es muy alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de CPU de base de datos de configuración alto | Mediano | manager, intelligence | El uso de la CPU del servicio Base de datos de configuración es alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de CPU de Métrica muy alto | Crítico | manager, intelligence | El uso de la CPU del servicio Métrica es muy alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de CPU de Métrica alto | Mediano | manager, intelligence | El uso de la CPU del servicio Métrica es alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de CPU de Análisis muy alto | Crítico | manager, intelligence | El uso de la CPU del servicio Análisis es muy alto. |
Escale horizontalmente todos los servicios o el servicio Análisis. |
3.2.0 |
Uso de CPU de Análisis alto | Mediano | manager, intelligence | El uso de la CPU del servicio Análisis es alto. |
Escale horizontalmente todos los servicios o el servicio Análisis. |
3.2.0 |
Uso de CPU de plataforma muy alto | Crítico | manager, intelligence | El uso de la CPU del servicio Servicios de plataforma es muy alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de CPU de plataforma alto | Mediano | manager, intelligence | El uso de la CPU del servicio Servicios de plataforma es alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de memoria del almacén de datos muy alto | Crítico | manager, intelligence | El uso de la memoria del servicio Almacenamiento de datos es muy alto. |
Escale horizontalmente todos los servicios o el servicio Almacenamiento de datos. |
3.2.0 |
Uso de memoria de almacén de datos alto | Mediano | manager, intelligence | El uso de la memoria del servicio Almacenamiento de datos es alto. |
Escale horizontalmente todos los servicios o el servicio Almacenamiento de datos. |
3.2.0 |
Uso de memoria de Mensajería muy alto | Crítico | manager, intelligence | El uso de la memoria del servicio Mensajería es muy alto. |
Escale horizontalmente todos los servicios o el servicio Mensajería. |
3.2.0 |
Uso de memoria de Mensajería alto | Mediano | manager, intelligence | El uso de la memoria del servicio Mensajería es alto. |
Escale horizontalmente todos los servicios o el servicio Mensajería. |
3.2.0 |
Uso de memoria de base de datos de configuración muy alto | Crítico | manager, intelligence | El uso de la memoria del servicio Base de datos de configuración es muy alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de memoria de base de datos de configuración alto | Mediano | manager, intelligence | El uso de la memoria del servicio Base de datos de configuración es alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de memoria de Métrica muy alto | Crítico | manager, intelligence | El uso de memoria del servicio Métrica es muy alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de memoria de Métrica alto | Mediano | manager, intelligence | El uso de memoria del servicio Métrica es alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de memoria de Análisis muy alto | Crítico | manager, intelligence | El uso de la memoria del servicio Análisis es muy alto. |
Escale horizontalmente todos los servicios o el servicio Análisis. |
3.2.0 |
Uso de memoria de Análisis alto | Mediano | manager, intelligence | El uso de la memoria del servicio Análisis es alto. |
Escale horizontalmente todos los servicios o el servicio Análisis. |
3.2.0 |
Uso de memoria de plataforma muy alto | Crítico | manager, intelligence | El uso de la memoria del servicio Servicios de plataforma es muy alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de memoria de plataforma alto | Mediano | manager, intelligence | El uso de la memoria del servicio Servicios de plataforma es alto. |
Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de disco de almacén de datos muy alto | Crítico | manager, intelligence | El uso del disco del servicio Almacenamiento de datos es muy alto. |
Escale horizontalmente o verticalmente el servicio Almacenamiento de datos. |
3.2.0 |
Uso de disco de almacén de datos alto | Mediano | manager, intelligence | El uso del disco del servicio Almacenamiento de datos es alto. |
Escale horizontalmente o verticalmente el servicio Almacenamiento de datos. |
3.2.0 |
Uso de disco de Mensajería muy alto | Crítico | manager, intelligence | El uso del disco del servicio Mensajería es muy alto. |
No es necesario limpiar los archivos. Escale horizontalmente todos los servicios o el servicio Mensajería. |
3.2.0 |
Uso de disco de Mensajería alto | Mediano | manager, intelligence | El uso del disco del servicio Mensajería es alto. |
No es necesario limpiar los archivos. Escale horizontalmente todos los servicios o el servicio Mensajería. |
3.2.0 |
Uso de disco de base de datos de configuración muy alto | Crítico | manager, intelligence | El uso del disco del servicio Base de datos de configuración es muy alto. |
No es necesario limpiar los archivos. Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de disco de base de datos de configuración alto | Mediano | manager, intelligence | El uso del disco del servicio Base de datos de configuración es alto. |
No es necesario limpiar los archivos. Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de disco de Métrica muy alto | Crítico | manager, intelligence | El uso del disco del servicio Métrica es muy alto. |
No es necesario limpiar los archivos. Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de disco de Métrica alto | Mediano | manager, intelligence | El uso del disco del servicio Métrica es alto. |
No es necesario limpiar los archivos. Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de disco de Análisis muy alto | Crítico | manager, intelligence | El uso del disco del servicio Análisis es muy alto. |
No es necesario limpiar los archivos. Escale horizontalmente todos los servicios o el servicio Análisis. |
3.2.0 |
Uso de disco de Análisis alto | Mediano | manager, intelligence | El uso del disco del servicio Análisis es alto. |
No es necesario limpiar los archivos. Escale horizontalmente todos los servicios o el servicio Análisis. |
3.2.0 |
Uso de disco de plataforma muy alto | Crítico | manager, intelligence | El uso del disco del servicio Servicios de plataforma es muy alto. |
No es necesario limpiar los archivos. Escalar horizontalmente todos los servicios. |
3.2.0 |
Uso de disco de plataforma alto | Mediano | manager, intelligence | El uso del disco del servicio Servicios de plataforma es alto. |
No es necesario limpiar los archivos. Escalar horizontalmente todos los servicios. |
3.2.0 |
Estado del servicio degradado | Mediano | manager, intelligence | El estado del servicio es degradado. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales para comprobar qué servicio está degradado. Invoque la NSX API GET /napp/api/v1/platform/monitor/feature/health para comprobar qué servicio específico está degradado y por qué. Invoque el siguiente comando de la CLI para reiniciar el servicio degradado si fuera necesario: kubectl rollout restart <statefulset/deployment> <nombre_servicio> -n <espaciodenombre>. Los servicios degradados funcionarán correctamente, pero el rendimiento no será óptimo. |
3.2.0 |
Estado del servicio inactivo | Alto | manager, intelligence | El estado del servicio es inactivo. |
En la interfaz de usuario de NSX, desplácese hasta Sistema | NSX Application Platform | Servicios principales para comprobar qué servicio está degradado. Invoque la NSX API GET /napp/api/v1/platform/monitor/feature/health para comprobar qué servicio específico está inactivo y por qué. Invoque el siguiente comando de la CLI para reiniciar el servicio degradado: kubectl rollout restart <statefulset/deployment> <nombre_servicio> -n &espacio_de_nombres> |
3.2.0 |
Eventos de estado de NSXaaS
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Servicio degradado | Alto | aas | Servicio degradado. |
Revise los datos incluidos en la descripción de la alarma que identifican el servicio donde se implementa el servicio y los datos adicionales capturados por el servicio de supervisión de estado. Revise también los datos históricos registrados por el servicio Métrica o Wavefront, según corresponda. |
4.1.0 |
Servicio inactivo | Crítico | aas | Servicio inactivo. |
Revise los datos incluidos en la descripción de la alarma que identifican el servicio donde se implementa el servicio y los datos adicionales capturados por el servicio de supervisión de estado. Revise también los datos históricos registrados por el servicio Métrica o Wavefront, según corresponda. |
4.1.0 |
Eventos del administración de contraseñas
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Contraseña caducada | Crítico | global-manager, manager, edge, public-cloud-gateway | La contraseña del usuario caducó. |
Es necesario cambiar la contraseña del usuario {usuario} para poder acceder al sistema. Por ejemplo, para aplicar una nueva contraseña a un usuario, invoque la siguiente NSX API con una contraseña válida en el cuerpo de la solicitud: PUT /api/v1/node/users/<id_usuario> donde <id_usuario> es el identificador del usuario. Si caducó la contraseña del usuario admin (con el <id_usuario> 10000), este deberá iniciar sesión en el sistema a través de SSH (si está habilitado) o de la consola para poder cambiar la contraseña. Tras introducir la contraseña actual caducada, se solicitará al usuario admin que introduzca una nueva contraseña. |
3.0.0 |
La contraseña está a punto de caducar | Alto | global-manager, manager, edge, public-cloud-gateway | La contraseña del usuario está a punto de caducar. |
Asegúrese de que la contraseña del usuario {usuario} se cambie inmediatamente. Por ejemplo, para aplicar una nueva contraseña a un usuario, invoque la siguiente NSX API con una contraseña válida en el cuerpo de la solicitud: PUT /api/v1/node/users/<id_usuario> donde <id_usuario> es el identificador del usuario. |
3.0.0 |
Método de caducidad de contraseña | Mediano | global-manager, manager, edge, public-cloud-gateway | La contraseña del usuario caducará pronto. |
La contraseña del usuario {usuario} se debe cambiar pronto. Por ejemplo, para aplicar una nueva contraseña a un usuario, invoque la siguiente NSX API con una contraseña válida en el cuerpo de la solicitud: PUT /api/v1/node/users/<id_usuario> donde <id_usuario> es el identificador del usuario. |
3.0.0 |
Eventos de servidor físico
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Error en la instalación del servidor físico | Crítico | manager | Error en la instalación del servidor físico (BMS). |
Desplácese hasta Sistema > Tejido > Nodos > Nodos de transporte de host y resuelva el error en el nodo. |
4.0.0 |
Error en la actualización del servidor físico | Crítico | manager | Error en la actualización del servidor físico (BMS). |
Desplácese hasta Sistema > Actualizar, resuelva el error y vuelva a activar la actualización. |
4.0.0 |
Error en la desinstalación del servidor físico | Crítico | manager | Error en la desinstalación del servidor físico (BMS). |
Desplácese hasta Sistema > Tejido > Nodos > Nodos de transporte de host y resuelva el error en el nodo. |
4.0.0 |
Eventos de restricción de directiva
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Se alcanzó el límite de creación | Mediano | manager | El recuento de entidades alcanzó el límite de restricción de la directiva. |
Revise el uso de {tipo_restricción}. Actualice la restricción para aumentar el límite o eliminar {tipo_restricción} que no se utilice. |
4.1.0 |
Eventos de enrutamiento
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
BFD inactivo en la interfaz externa | Alto | edge, autonomous-edge, public-cloud-gateway | La sesión de BFD está inactiva. |
1. Invoque el comando de la CLI de NSX get logical-routers. |
3.0.0 |
Enrutamiento estático eliminado | Alto | edge, autonomous-edge, public-cloud-gateway | Ruta estática eliminada. |
Se quitó la entrada de enrutamiento estático debido a que la sesión de BFD estaba inactiva. |
3.0.0 |
BGP inactivo | Alto | edge, autonomous-edge, public-cloud-gateway | Vecino BGP inactivo. |
1. Invoque el comando de la CLI de NSX get logical-routers. |
3.0.0 |
ARP de proxy no configurado para la IP de servicio | Crítico | manager | El ARP de proxy no está configurado para la IP de servicio |
Vuelva a configurar la IP de servicio {ip_servicio} para la entidad de servicio {id_entidad} o cambie la subred de lrport {id_lrport} en el enrutador {id_lr} de modo que el número de entradas ARP del proxy generadas por la superposición entre la IP de servicio y la subred de lrport sea menor que el límite de umbral permitido de 16384. |
3.0.3 |
Enrutamiento inactivo | Alto | edge, autonomous-edge, public-cloud-gateway | Todas las sesiones de BGP/BFD están inactivas. |
Invoque el comando de la CLI de NSX get logical-routers para obtener el enrutador de servicio de nivel 0 y cambie a este VRF. A continuación, invoque los siguientes comando de la CLI de NSX. |
3.0.0 |
El vecino de OSPF se desconectó | Alto | edge, autonomous-edge, public-cloud-gateway | El vecino de OSPF cambió de un estado completo a otro estado. |
1. Invoque el comando de la CLI de NSX get logical-routers para obtener el identificador de VRF y cambiar al enrutador de servicio nivel 0. |
3.1.1 |
El límite máximo de rutas IPv4 está próximo | Mediano | edge, autonomous-edge, public-cloud-gateway | El límite máximo de rutas IPv4 está próximo en el nodo de Edge. |
1. Compruebe las directivas de redistribución de rutas y las rutas recibidas de todos los elementos del mismo nivel externos. |
4.0.0 |
Está a punto de alcanzarse el límite máximo de rutas IPv6 | Mediano | edge, autonomous-edge, public-cloud-gateway | El límite máximo de rutas IPv6 está próximo en el nodo de Edge. |
1. Compruebe las directivas de redistribución de rutas y las rutas recibidas de todos los elementos del mismo nivel externos. |
4.0.0 |
Se superó el máximo de rutas IPv4 | Crítico | edge, autonomous-edge, public-cloud-gateway | Se superó el límite máximo de rutas IPv4 en el nodo de Edge. |
1. Compruebe las directivas de redistribución de rutas y las rutas recibidas de todos los elementos del mismo nivel externos. |
4.0.0 |
Se superó el máximo de rutas IPv6 | Crítico | edge, autonomous-edge, public-cloud-gateway | Se superó el límite máximo de rutas IPv6 en el nodo de Edge. |
1. Compruebe las directivas de redistribución de rutas y las rutas recibidas de todos los elementos del mismo nivel externos. |
4.0.0 |
El máximo de prefijos IPv4 desde el vecino de BGP está próximo | Mediano | edge, autonomous-edge, public-cloud-gateway | El número máximo de prefijos IPv4 recibidos del vecino BGP está próximo. |
1. Compruebe las directivas de enrutamiento de BGP en el enrutador externo. |
4.0.0 |
El máximo de prefijos IPv6 desde el vecino de BGP está próximo | Mediano | edge, autonomous-edge, public-cloud-gateway | El número máximo de prefijos IPv6 recibidos del vecino BGP está próximo. |
1. Compruebe las directivas de enrutamiento de BGP en el enrutador externo. |
4.0.0 |
Se superó el máximo de prefijos IPv4 desde el vecino de BGP | Crítico | edge, autonomous-edge, public-cloud-gateway | Se superó el máximo de prefijos IPv4 recibidos del vecino de BGP. |
1. Compruebe las directivas de enrutamiento de BGP en el enrutador externo. |
4.0.0 |
Se superó el máximo de prefijos IPv6 desde el vecino de BGP | Crítico | edge, autonomous-edge, public-cloud-gateway | Se superó el máximo de prefijos IPv6 recibidos del vecino BGP. |
1. Compruebe las directivas de enrutamiento de BGP en el enrutador externo. |
4.0.0 |
Eventos de cumplimiento de seguridad
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Activar no conformidad con NDcPP | Crítico | manager | El estado de seguridad de NSX no es conforme con NDcPP. |
Ejecute el informe de conformidad desde el menú Inicio de la interfaz de usuario - Supervisión y Panel de control - Informe de conformidad y resuelva todos los problemas marcados con el nombre de conformidad NDcPP. |
4.1.0 |
Activar no conformidad con EAL4 | Crítico | manager | El estado de seguridad de NSX no es conforme con EAL4+. |
Ejecute el informe de conformidad desde el menú Inicio de la interfaz de usuario - Supervisión y Panel de control - Informe de conformidad y resuelva todos los problemas marcados con el nombre de conformidad EAL4+. |
4.1.0 |
Sondear no conformidad con NDcPP | Crítico | manager | La configuración de seguridad NSX no es conforme con NDcPP. |
Ejecute el informe de conformidad desde el menú Inicio de la interfaz de usuario - Supervisión y Panel de control - Informe de conformidad y resuelva todos los problemas marcados con el nombre de conformidad NDcPP. |
4.1.0 |
Sondear no conformidad con EAL4 | Crítico | manager | La configuración de seguridad NSX no es conforme con EAL4+. |
Ejecute el informe de conformidad desde el menú Inicio de la interfaz de usuario - Supervisión y Panel de control - Informe de conformidad y resuelva todos los problemas marcados con el nombre de conformidad EAL4+. |
4.1.0 |
Eventos de inserción de servicios
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Servicio implementado correctamente | Información | manager | La implementación del servicio se realizó correctamente. |
No es necesario realizar ninguna acción. |
4.0.0 |
Error en la implementación del servicio | Crítico | manager | Error en la implementación del servicio. |
Elimine la implementación del servicio mediante la API o la interfaz de usuario de NSX. Realice cualquier acción correctiva de la base de conocimientos y vuelva a intentar la implementación del servicio. |
4.0.0 |
Implementación de servicio anulada correctamente | Información | manager | La eliminación de la implementación del servicio se realizó correctamente. |
No es necesario realizar ninguna acción. |
4.0.0 |
Error al anular la implementación del servicio | Crítico | manager | Error al eliminar la implementación del servicio. |
Elimine la implementación del servicio mediante la API o la interfaz de usuario de NSX. Realice cualquier acción correctiva de la base de conocimientos y vuelva a intentar eliminar la implementación del servicio. Resuelva la alarma manualmente después de comprobar que se eliminaron todos los objetos y la máquina virtual. |
4.0.0 |
Estado de mantenimiento de SVM activo | Información | manager | La SVM está funcionando en el servicio. |
No es necesario realizar ninguna acción. |
4.0.0 |
Estado de mantenimiento de SVM inactivo | Alto | manager | La SVM no funciona en el servicio. |
Elimine la implementación del servicio mediante la API o la interfaz de usuario de NSX. Realice cualquier acción correctiva de la base de conocimientos y vuelva a intentar la implementación del servicio si es necesario. |
4.0.0 |
Estado de infraestructura de inserción de servicios inactivo | Crítico | esx | Estado de la infraestructura de inserción de servicios inactivo y no habilitado en el host. |
Realice cualquier acción correctiva indicada en la base de conocimientos y compruebe si el estado es activo. Resuelva la alarma manualmente después de comprobar el estado. |
4.0.0 |
Estado de ejecución de SVM inactivo | Crítico | manager | Estado de ejecución de SVM inactivo. |
Realice cualquier acción correctiva indicada en la base de conocimientos y compruebe si el estado es activo. |
4.0.0 |
Ruta de cadena de servicios inactiva | Crítico | manager | Ruta de cadena de servicios inactiva. |
Realice cualquier acción correctiva indicada en la base de conocimientos y compruebe si el estado es activo. |
4.0.0 |
Nuevo host agregado | Información | esx | Se agregó un nuevo host al clúster. |
Compruebe el estado de implementación de la máquina virtual y espere hasta que se encienda. |
4.0.0 |
Eventos de estado de TEP
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
TEP con errores | Mediano | esx | El estado de TEP es incorrecto. |
1. Compruebe si TEP tiene una IP válida o cualquier otro problema de conectividad subyacente. |
4.1.0 |
TEP HA activado | Información | esx | TEP HA activado. |
Habilite la recuperación automática o invoque la recuperación manual para TEP:{nombre_vtep} en VDS:{nombre_dvs} en el nodo de transporte:{id_nodo_transporte}. |
4.1.0 |
Recuperación automática de TEP correcta | Información | esx | La recuperación automática se realizó correctamente. |
Ninguna. |
4.1.0 |
Error de recuperación automática de TEP | Mediano | esx | Error de recuperación automática. |
Compruebe si TEP tiene una IP válida o cualquier otro problema de conectividad subyacente. |
4.1.0 |
TEP con errores en la DPU | Mediano | dpu | El TEP tiene un estado incorrecto en la DPU. |
1. Compruebe si TEP tiene una IP válida o cualquier otro problema de conectividad subyacente. |
4.1.0 |
TEP HA activado en DPU | Información | dpu | TEP HA activado en DPU. |
Habilite la recuperación automática o invoque la recuperación manual para TEP:{nombre_vtep} en VDS:{nombre_dvs} en el nodo de transporte:{id_nodo_transporte} en la DPU {id_dpu}. |
4.1.0 |
Recuperación automática de TEP correcta en DPU | Información | dpu | La recuperación automática se realiza correctamente en la DPU. |
Ninguna. |
4.1.0 |
Error de recuperación automática de TEP en DPU | Mediano | dpu | Error de recuperación automática en la DPU. |
Compruebe si TEP tiene una IP válida o cualquier otro problema de conectividad subyacente. |
4.1.0 |
Eventos de estado del nodo de transporte
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Vínculo superior de nodo de transporte inactivo en DPU | Mediano | dpu | El vínculo superior en DPU se está desconectando. |
Compruebe el estado de las NIC físicas de los vínculos superiores en la DPU {id_dpu}. Averigüe el nombre asignado de esta NIC física en el host y, a continuación, realice una comprobación de la interfaz. |
4.0.0 |
Miembro de LAG inactivo en la DPU | Mediano | dpu | LACP en la DPU informa de que el miembro está inactivo. |
Compruebe el estado de la conexión de los miembros de LAG en la DPU {id_dpu}. Busque el nombre asignado de la NIC física relacionada en el host y, a continuación, realice la comprobación en la interfaz de usuario. |
4.0.0 |
Vínculo superior de NVDS inactivo | Mediano | esx, kvm, bms | El vínculo superior se está desconectando. |
Compruebe el estado de las NIC físicas de los vínculos superiores de los hosts. |
3.0.0 |
Vínculo activo de nodo de transporte inactivo | Mediano | esx, kvm, bms | El vínculo superior se está desconectando. |
Compruebe el estado de las NIC físicas de los vínculos superiores de los hosts. |
3.2.0 |
Miembro LAG inactivo | Mediano | esx, kvm, bms | LACP informa que el miembro está inactivo. |
Compruebe el estado de la conexión de los miembros de LAG en los hosts. |
3.0.0 |
Eventos de aplicación de VMC
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
Error de conexión de tránsito | Mediano | manager | Transit Connect no se realizó por completo. |
Si esta alarma no se resuelve automáticamente en 10 minutos, vuelva a intentar las solicitudes relacionadas con Transit Connect más recientes. Por ejemplo, si una solicitud de API de asociación de TGW activó esta alarma, vuelva a intentar la solicitud de API de asociación de TGW. Si la alarma tampoco se resuelve después de esto, pruebe los siguientes pasos: |
4.1.0 |
Eventos de VPN
Nombre del evento | Gravedad | Tipo de nodo | Mensaje de alerta | Acción recomendada | Versión introducida |
---|---|---|---|---|---|
El servicio IPsec está inactivo | Mediano | edge, autonomous-edge, public-cloud-gateway | El servicio IPsec está inactivo. |
1. Deshabilite y habilite el servicio IPsec desde la interfaz de usuario de NSX Manager. |
3.2.0 |
Sesión basada en directiva de IPsec inactiva | Mediano | edge, autonomous-edge, public-cloud-gateway | La sesión de VPN de IPsec basada en directivas está inactiva. |
Compruebe la configuración de la sesión de VPN de IPsec y resuelva los errores según el motivo de inactividad de la sesión. |
3.0.0 |
Sesión basada en rutas de IPsec inactiva | Mediano | edge, autonomous-edge, public-cloud-gateway | La sesión de VPN de IPsec basado en rutas está inactiva. |
Compruebe la configuración de la sesión de VPN de IPsec y resuelva los errores según el motivo de inactividad de la sesión. |
3.0.0 |
Túnel basado en directiva de IPsec inactivo | Mediano | edge, autonomous-edge, public-cloud-gateway | Los túneles de VPN de IPsec basados en directivas están inactivos. |
Compruebe la configuración de la sesión de VPN de IPsec y resuelva los errores según el motivo de inactividad del túnel. |
3.0.0 |
Túnel basado en rutas de IPsec inactivo | Mediano | edge, autonomous-edge, public-cloud-gateway | El túnel de VPN de IPsec basado en rutas está inactivo. |
Compruebe la configuración de la sesión de VPN de IPsec y resuelva los errores según el motivo de inactividad del túnel. |
3.0.0 |
Sesión de L2VPN inactiva | Mediano | edge, autonomous-edge, public-cloud-gateway | La sesión de L2VPN está inactiva. |
Compruebe el estado de la sesión de L2VPN para determinar el motivo de que esté inactiva y resuelva los errores según sea necesario. |
3.0.0 |