Munin est un traceur de courbe qui prend ses valeurs en résultat d’une commande. Cela permet de surveiller de manière visuelle les indicateurs de santé d’une machine ou d’un réseau de machine. C’est un projet peu actif mais les sondes existantes sont suffisantes pour les besoins de base tel que controler l’espace disque, la consommation mémoire, la température ou la vitesse des ventilateurs. C’est d’ailleur ce dernier qui nous intéresse.
Le module de gestion des capteurs détecte sur ma carte mère 3 sondes de ventilateur. Or dans mon cas seul le ventilateur de processeur est branché et comme le plugin munin lit les valeurs de tous les capteurs, il déclenche une alerte à cause de 2 ventilateurs tournant à 0 tour/mn.
Une première étape consiste à désactiver le tracage de courbe pour ces ventilateurs fantômes. Pour cela il faut ajouter les lignes suivantes dans le fichier /etc/munin/plugin-conf.d/munin-node
[sensors_fan]
env.ignore_fan2 1
env.ignore_fan3 1
A ce stade les 2 ventilateurs inexistants ne sont plus dans le graph mais munin continue à envoyer des alertes. Dans mon cas ma boîte mail s’est remplie de messages…
Pour aller plus loin il faut modifier le plugin munin sensors_fan à la fonction fan_threshold
sub fan_threshold {
my $name = shift;
my $min = shift;
my $warn_percent = exists $ENV{fan_warn_percent} ? $ENV{fan_warn_percent} : 5;
if ( exists $ENV{"ignore_$name"} ) { return }
return unless defined $min;
printf "$name.warning %d:n", $min * (100 + $warn_percent) / 100; printf "$name.critical %d:n", $min; }Tags: Monitoring Munin