No dejes que suene el teléfono! usa Nagios

Son las ocho de la mañana y recibes una llamada notificando que la aplicación web ha dejado de funcionar! al intenta acceder a la página simplemente no carga.

¿Qué puede estar ocurriendo? ¿Será el cortafuego? ¿El servidor que aloja la página web esté caído?.

Antes de empezar a pensar racionalmente sobre lo que está ocurriendo recibes otra llamada de tu jefe pidiendo una explicación. En esta situación de pánico empiezas a reiniciar, encender, desconectar y conectar todo.. y nada!

Entonces, ¿dónde está el problema?

Después de muchas horas de nerviosismo finalmente logras encontrar la solución: El servidor web esta funcionando correctamente! pero el problema fue el tiempo de respuesta entre la comunicación con el servidor de base de datos, debido a que el servidor DHCP no estaba asignando IP. El servidor DHCP había quedado sin memoria, por lo tanto,  había dejado de funcionar. Sería una pesadilla si el servidor de base de datos está en otra sucursal de la empresa, y en una zona horaria diferente.

Con un sistema de Nagios configurado correctamente, el administrador ya se habría dado cuenta del problema  y ha sido capaz de resolver en pocos minutos:

Usted sólo tiene que:

  • Ir a la interfaz web de Nagios
    Verificar que no hay problemas con: el servicio web y el host
    Verificar que el servidor web se está ejecutando.
  • También habría una lista de lo que está mal:
    El servidor DHCP no está asignando IP
    La base de datos es inalcanzable.

Nagios también supervisa el servidor DHCP, y envía una notificación por email informando que muy poca memoria de intercambio está disponible, o que muchos procesos se están ejecutando. Tal vez sería conveniente tener un controlador de eventos para estos casos,  simplemente matar o reiniciar procesos no críticos. En este caso, Nagios trataría de reiniciar el proceso de servidor DHCP en la red.

Si los servicios hubiesen  sido objeto de seguimiento con Nagios, el departamento de TI se habría advertido en una etapa temprana y el teléfono no hubiese sonado.

¿Qué es Nagios?

Nagios es una herramienta de código abierto para monitorear componentes en una infraestructura de TI, incluyendo protocolos de red, aplicaciones, servicios, servidores y la infraestructura de red, ayudando al  administrador detectar problemas antes de que suene el teléfono.

En este blog voy a tratar de explicar algunas funcionalidades de Nagios, como también, la configuración de hosts y servicios del lado del servidor, configuración de los clientes con NRPE, plugin y addons.

Hasta la próxima…!!

Anuncios

4 comentarios

  1. Excelente. Una pregunta: Funciona para todo tipo de plataformas?… Es decir, CentOS, Windows Server, etc?

    Me gusta

    1. Nagios los podes instalar en casi cualquier distribución de Linux (RHEL/CentOS, Fedora, Ubuntu, Debian.. etc)

      Nagios proporciona una monitorización completa indepedendiente del sistemas operativos – incluyendo medidas del sistema , los estados de servicio, estados del proceso, los contadores de rendimiento, registros de eventos, aplicaciones (Apache, IIS , Exchange, etc ), y servicios ( Active Directory, DHCP, SMTP, POP3, HTTP, SNMP. etc ). En este contexto es multiplataforma.

      Para monitorear servidores en Windows se utiliza la herramienta NSClient++ como cliente. Para sistemas con linux es necesario el cliente NRPE. Para equipos como router, switch, access point, incluso impresoras es mediante el protocolo SNMP.

      Me gusta

  2. Reblogueó esto en HackNic_LatinoAmericay comentado:
    Interezante Post

    Me gusta

  3. Interezante Saludos

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: