Munin - aller 5 Minuten eine Mail mit fatalem Fehler
misterunknown
- webserver
Moin,
ich habe einen Munin auf dem Server laufen und soweit läuft alles gut. Ich habe allerdings jetzt einen Email-Alias von root auf marco gemacht, damit ich diese Mails mit bekomme und dadurch festgestellt, dass Munin aller 5 Minuten eine Mail mit einem fatalem Error schickt:
From: root@themisterunknown.de (Cron Daemon)
To: root@themisterunknown.de
Subject: Cron <munin@themisterunknown> if [ -x /usr/bin/munin-cron ]; then /usr/bin/munin-cron; fi
Content-Type: text/plain; charset=ANSI_X3.4-1968
X-Cron-Env: <MAILTO=root>
X-Cron-Env: <SHELL=/bin/sh>
X-Cron-Env: <HOME=/var/lib/munin>
X-Cron-Env: <PATH=/usr/bin:/bin>
X-Cron-Env: <LOGNAME=munin>
Message-Id: <20130210125019.8AAEC19A635@themisterunknown.de>
Date: Sun, 10 Feb 2013 12:50:19 +0000 (UTC)
[FATAL ERROR] Lock already exists: /var/run/munin/munin-limits.lock. Dying.
at /usr/share/perl5/Munin/Master/LimitsOld.pm line 114
Ich weiß nicht, wie ich selbiges unterbinden kann. Ich habe jetzt erstmal den Prozess gekillt, der das hervorgerufen hat, aber das Problem steckt tiefer. Hier steht, dass es sich um einen behobenen Bug handelt. Allerdings habe ich die Version 1.4.6; hier passiert es trotzdem.
Die Mail kommt auch, wenn der lokale Munin-Node nicht läuft. Deshalb vermute ich, dass es an Munin selbst liegt. Allerdings weiß ich nicht, an was es liegen könnte. Die Konfigurationsdatei sieht folgendermaßen aus:
includedir /etc/munin/munin-conf.d
contacts me
contact.me.command mail -s "Munin notification" marco@themisterunknown.de
contact.me.always_send warning critical
[localhost.localdomain]
address 127.0.0.1
use_node_name yes
wobei das Verzeichnis munin-conf.d/ leer ist.
Hat jemand eine Idee?
Grüße Marco
Tach!
[...] festgestellt, dass Munin aller 5 Minuten eine Mail mit einem fatalem Error schickt:
[FATAL ERROR] Lock already exists: /var/run/munin/munin-limits.lock. Dying.
at /usr/share/perl5/Munin/Master/LimitsOld.pm line 114[/code]
Die Mail kommt auch, wenn der lokale Munin-Node nicht läuft. Deshalb vermute ich, dass es an Munin selbst liegt.
Wenn es alle 5 Minuten kommt, muss es vom Munin (Teil: Dateneinsammler und Auswerter) kommen oder zumindest initialisiert werden, denn der wird per cron-Job alle 5 Minuten ausgeführt. Der Munin-Node sitzt nur da und wartet auf Abfragen. Allerdings startet der auf eine solche hin seine Abfragescripts.
Hat jemand eine Idee?
Vielleicht ist die Datei ein Überbleibsel aus einem früheren Absturz. Einfach mal löschen. Wenn das nicht hilft das gesamte /var/run/munin und Munin reinstallieren. Vorher die /etc-Dateien von Munin sichern.
Außerdem können eventuell noch weitere Informationen in den Logfiles zu finden sein.
dedlfix.
Moin,
Vielleicht ist die Datei ein Überbleibsel aus einem früheren Absturz. Einfach mal löschen. Wenn das nicht hilft das gesamte /var/run/munin und Munin reinstallieren. Vorher die /etc-Dateien von Munin sichern.
Ich probiers mal. Zwischenzeitlich hatte ich einfach den Cronjob gekillt, aber das ist ja keine Lösung.
Außerdem können eventuell noch weitere Informationen in den Logfiles zu finden sein.
In den Log-Files stand seitenlang nur eben jeder Fehler, der auch per Mail gekommen ist. Vielleicht habe ich aber auch etwas übersehen.
Grüße Marco
Tach,
ich habe einen Munin auf dem Server laufen und soweit läuft alles gut. Ich habe allerdings jetzt einen Email-Alias von root auf marco gemacht, damit ich diese Mails mit bekomme und dadurch festgestellt, dass Munin aller 5 Minuten eine Mail mit einem fatalem Error schickt:
könnte es sein, dass die Last auf deinem Server zu hoch ist und munin deshalb nicht mehr fertig wird? Meiner Erfahrung nach wäre es dann allerdings eher der munin-graph-Prozess, der Probleme macht.
mfg
Woodfighter
Moin,
könnte es sein, dass die Last auf deinem Server zu hoch ist und munin deshalb nicht mehr fertig wird? Meiner Erfahrung nach wäre es dann allerdings eher der munin-graph-Prozess, der Probleme macht.
Theoretisch solle der Server gar keine Last haben... die paar Zugriffe per HTTP und SSH sind ja eigentlich zu vergessen. Aber ich gucke mir mal die Last an. Vielleicht hat ja irgendetwas anders die Last erhöht.
Grüße Marco