Comparatif des outils de supervision
Principe de base de la supervision
Principe global
Avant toute chose, le principe de la supervision est de s'assurer du bon fonctionnement d'un système. Il peut étre appliqué sur plusieurs entités : serveurs, équipements réseaux, firewall, ...
Sa mise en place permet d'effectuer des actions proactives et ainsi détecter un éventuel problème avant qu'il survienne.
En général, lorsque l'on est en présence d'une grosse infrastructure, on délègue la gestion des alertes à des masters de supervision qui sont chargés de récolter les informations venant des équipements.
La mise en place d'une solution de supervision permet d'avoir une vue d'ensemble des équipements supervisés, et ceci en temps-réel. Elle permet de visualiser à tout moment l'état des différents équipements configurés.
Les objectifs sont multiples :
- Eviter les arrêts de service
- Remonter des alertes
- Détecter et prévenir les pannes
En configurant la solution de supervision, un utilisateur peut être informé à n'importe quel moment des problèmes qui peuvent survenir sur les équipements. On appelle ce type d'évènement une alarme. Il s'agit d'un évènement potentiellement problématique pouvant entraîner le mauvais fonctionnement du système. Par exemple, lorsq'un disque dur atteint une occupation du disque de plus de 90%, une alarme est générée afin de nous prévenir qu'il faut y remédier. L'alarme est alors visible sur l'interface de la solution de supervision mais surtout elle peut être transmise via un e-mail ou un sms à un ou plusieurs destinataires afin de les tenir informé immédiatemment.
" Mieux vaut prévenir que guérir " -- [Proverbe français]
Objectifs
Il existe différent types d'outils de supervision ayant chacun leurs qualités et leurs défaults.
- Solutions propriétaires couteuses
- Utilisation d'outils open source qui ont fait leurs preuves
" Trop d'information, tue l'information " -- [Proverbe français]
Exemples d'éléments à superviser
- Serveurs : CPU, mémoire, processus, espace disque, services, ...
- Matériels : Disques, cartes Raid, cartes réseau, température, alimentations, onduleurs, ...
- Réseaux : Bande passante, protocoles, switchs, routeurs, Firewall, accès externes, bornes wi-fi, ...