Monitorización en tiempo real con Nagios
Monitorizar el estado de los dispositivos y sevicios de una red o infraestructura es una tarea complicada a la vez que necesaria. Nagios puede supervisar todo tipo de equipos gracias a los plugins o módulos desarrollados. Unos opensource, otros comerciales, que nos permitirán conocer como están nuestros equipos en tiempo real. Nadie pone en duda que una reacción rápida es una ventaja competitiva. Pero, ¿qué ocurre cuando un exceso de alertas en tiempo real se convierte en una distracción? ¿la supervisión en tiempo real siempre es mejor?
¿Cómo funciona Nagios?
Nagios es un sistema de monitorización de redes ampliamente utilizado, de código abierto, que vigila los equipos (hardware) y servicios (software) que se especifiquen, alertando cuando el comportamiento de los mismos no sea el deseado. Entre sus características principales figuran la monitorización de servicios de red (SMTP, POP3, HTTP, SNMP…), la monitorización de los recursos de sistemas hardware (carga del procesador, uso de los discos, memoria, estado de los puertos…), independencia de sistemas operativos, posibilidad de monitorización remota mediante túneles SSL cifrados o SSH, y la posibilidad de programar plugins específicos para nuevos sistemas.
Se trata de un software que proporciona una gran versatilidad para consultar prácticamente cualquier parámetro de interés de un sistema, y genera alertas, que pueden ser recibidas por los responsables correspondiente, cuando estos parámetros exceden de los márgenes definidos por el administrador de red.
¿Cómo hace Nagios la monitorización en tiempo real?
Las trampas SNMP son un ejemplo clásico de monitorización en tiempo real. Por ejemplo en Nagios XI, puede configurarse una alerta cuando un dispositivo se conecta a una interfaz. Inmediatamente el dispositivo envía un mensaje a Nagios y se produce un evento supervisado, en el que las personas responsables reciben una notificación instantánea.
Más allá de los dispositivos de red también puede usar NCPA con Nagios XI para recibir alertas de la infraestructura del servidor.
No podemos olvidar las capacidades de monitoreo en tiempo real de Nagios Log Server, que puede alertar y notificar casi instantáneamente con los datos de registro que recibe de servidores, dispositivos de red y aplicaciones.
¿Cúando la monitorización en tiempo real no es útil?
El monitoreo en tiempo real implica un flujo continuo de datos de rendimiento entregados en intervalos muy cortos, segundos normalmente.
El gráfico que se acompaña a continuación muestra las E / S de disco de las métricas internas de un host. Si lo observamos con atención podemos ver claramente un pico de datos.
Sin embargo, la pregunta clave es: ¿queremos notificar al equipo de monitorización sobre este aumento en los datos? Este es un pico transitorio en una métrica de rendimiento. No es persistente. Muchas métricas de rendimiento aumentan momentáneamente y recuperan el rendimiento normal.
Enviar una notificación inmediata sobre un pico de datos de rendimiento como el del gráfico anterior conduce a un problema llamado fatiga de notificación. Los equipos se ven tan abrumados por las notificaciones que no son significativas, así que comienzan a ignorarlas. Hecho que resulta contraproducente para la organización.
Este ejemplo deja en claro que lo que importa para muchas notificaciones de datos de rendimiento no es la longitud absoluta del intervalo entre los puntos de datos, sino la persistencia del problema en el tiempo. Y es que las métricas de rendimiento de muestreo demasiado frecuentes pueden tener un impacto negativo en el rendimiento de los dispositivos que se supervisan.
Por este motivo, Nagios tiene una lógica de verificación incorporada que permite su configuración exclusiva para notificar solo sobre aquellos problemas persistentes. Únicamente cuando la utilización de la E / S del disco o la CPU o el ancho de banda aumentan por encima de un cierto umbral problemático, y permanecen así durante un cierto período de tiempo, se alertará al equipo correspondiente.
Contacta con nosotros para más información.