Monitoring des serveurs
Description
Paramétrer Zabbix un quelconque service de monitoring correctement.
Ce que nous voulons voir :
- Un tableau de bord permettant de voir en un coup d'œil l'utilisation des CPU/RAM/DD sur chaque VM+hyperviseur.
- Pourquoi ? Parce que ça permet de faire de l'analyse “à chaud”, voir où on a un souci, où il faut booster les machines, quel effet ça fait sur les machines quand tout le groupe va sur un des services. Ce tableau n'est pas intéressant tout le temps, mais permet dans certains cas de comprendre si ça rame vraiment ou si c'est juste une impression.
- Une analyse des logs (en particulier apache/nginx) afin de détecter les problèmes. Demande de savoir analyser, configurer la détection d'erreur, on est déjà à un autre niveau de difficulté.
- Un tableau de bord des états des divers services et journal des alertes qu'ils ont pu avoir.
- Paramétrer l'envoi d'un mail aux admin+notif xmpp via pendorid après 15min de down d'un service. Pas moins, on est pas Amazon, on sait que nos services sont pas up 100% du temps… mais au delà de 15 ou 30min on peut commencer à s'en inquiéter.
- Ping sur les VM/serveur et mail lorsque l'un d'eux ne répond plus depuis plus de 30 min.
- En profiter pour loguer et analyser l'utilisation du réseau, détecter les pointes d'affluences, le possible engorgement que cela peut produire sur certaines VM.
À noter, l'idée est de mutualiser avec ./play.it et Debian Facile.
Qui travaille dessus ?
Compétences demandées
- accès admin
- compétences sur un service de monitoring (icinga2 ? netdata ? zabbix ?)
Difficulté estimée ou temps restant à y passer
Longtemps !