Select Page

NETWAYS Blog

Icinga/Nagios Ampel – Fortschritt und Alteisen

Wir haben schon bei einigen Kunden mit Erfolg und großer Akzeptanz im Großraumbüro die Nagios Ampel eingesetzt.
Heute war ich auf dem regionalen Schrottplatz und habe feuchte Augen bekommen. Dort ist zwischen alten Autos und Baumaschinen auch Industrietechnik gelandet. An der Anlage die ich dort fand, war ebenfalls eine Ampel angebracht. Im Gegensatz zu der in unserem Shop (im Moment sogar als Ausstellungsstück zum Sonderpreis) erhältlichen Ampel fehlt der Ampel auf dem Schrottplatz aber der USB Anschluss und das Icinga als Backend. Vermutlich wurde die Technik wegen der harten Verdrahtung und der rudimentären Monitoring- und Steuerkonsole ausgemustert.
Ich hoffe dass dort wo die Anlage zuvor im Einsatz war, nun ein System eingesetzt wird, welches auf Open Source Lösungen setzt. Bei so einer Umstellung hätten wir natürlich helfen können. In diesem Fall war Netways, soweit ich weiss, allerdings nicht beteiligt.

Die Puppen vorangehen lassen

Auch unser Kunde RWE Dea setzt Puppet zur Konfiguration seiner Server ein. Im Jahr 2011 ist die Verbreitung des open source Werkzeugs für IT systems management schon deutlich gewachsen. Das war schon auf unserer Open Source Data Center Konferenz 2011 zu merken, und schlägt sich seit dem auch in den Schulungs-/Beratungsaufträgen deutlich nieder.
Die nächste Puppet Schulung ist vom 27. – 29. März 2012 in Nürnberg. Ich würde mich freuen den ein oder anderen von euch dort zu sehen.

Ich durfe letztens für ein Training in die Hansestadt an der Elbe reisen und hatte beim Anflug sehr gutes Wetter. Das habe ich bei der Gelegenheit im Bild festgehalten. In Hamburg war zum Glück nicht gerade Messe – somit war es kein Problem ein Hotel zu finden, dafür gabs dann aber einen Feueralarm bei dem sich die Gäste des Amedia Hotels kennenlernen konnten. Abgebrannt ist glücklicher Weise nichts. Allerdings war die Nacht dadurch etwas kürzer.

Auch das geflügelte Pferd nutzt Icinga

Bei unserem Kunden Pegasus GmbH wird Icinga zur Überwachung eingesetzt. So weit so normal. Um die damit gesammelten Performance Daten aber weiterverarbeiten zu können, war es wichtig von der Speicherung in RRD Dateien zur Datenhaltung in einer SQL Datenbank zu wechseln. Diesen Schritt haben wir inzwischen vollzogen. Wir werden weiter Erfahrungen sammeln und zu gegebener Zeit über diese hier berichten.
Freut Euch auf the next big thing ;-).

Neues Check-Plugin für Gude Sensoren

Die Gude Sensoren, die Sie bei uns im Shop bekommen können, haben ein neues Plugin bekommen.
Es werden folgende Geräte zur Überwachung von Temperatur, Luftfeuchtigkeit und Strom/Spannung unterstützt:

  • expert net control 2101/2151
  • expert net control 2120 2100/2150
  • expert sensor box 7212 (noch nicht verfügbar)
  • Gude Stromleisten inkl. Verbrauchsmessung (noch nicht verfügbar)


Das Plugin (check_gude.pl) für Nagios/Icinga ist hier zu finden.
Beispiele für den Aufruf des Plugins:
check_gude.pl -H sensorbox -k Temp1 -w 15 -c 25
may give you:
expert sensor box 7212: WARNING – WARNING: Temp1=22.9C (w:15, c:25)
You may check multiple values at a time:
check_gude.pl -H sensorbox -k Temp1 -w 15 -c 25 -k Hygro1 -w 10 -c 20
with the following result:
expert sensor box 7212: CRITICAL – CRITICAL: Hygro1=39.1% (w:10, c:20) WARNING: Temp1=22.9C (w:15, c:25)
Further on you may rename keys:
check_gude.pl -H sensorbox -k Temp1 -w 15 -c 25 -k Hygro1 -w 10 -c 20 -l Humidity
with leads to this:
expert sensor box 7212: CRITICAL – CRITICAL: Humidity=39% (w:10, c:20)
You can give it an [other] unit
check_gude.pl -H sensorbox -k Temp1 -w 15 -c 25 -u °
may give you:
expert sensor box 7212: WARNING – WARNING: Temp1=22.9° (w:15, c:25)
And you can multiply it by a factor:
check_gude.pl -H sensorbox -k Temp1 -w 15 -c 25 -u ” -f 1
may give you:
expert sensor box 7212: CRITICAL – CRITICAL: Temp1=229 (w:15, c:25)
note: because there is a default factor of 0.1 for the temperature,
a factor of 1 leads to this (SNMP gives tenth of a degree often).
Some more examples:
check_gude.pl -H netcontrol -k Temp1 -w 11 -c 21 -k Temp2 -w 12 -c 22
expert net control 2151: CRITICAL – CRITICAL: Temp1=-999.9C (w:11, c:21) WARNING: Temp2=21C (w:12, c:22)
there is no sensor connected for Temp1.
Test if there is something connected to the Input1:
check_gude.pl -H nc2i2o -k Input1 -w 1: -c 1:
expert net control 2i2o 2100/2150: OK – OK: Input1=1 (w:1:, c:1:)
check_gude.pl -H nc2i2o -k Input1 -w 1: -c 1:
expert net control 2i2o 2100/2150: CRITICAL – CRITICAL: Input1=0 (w:1:, c:1:)
Test if there is nothing connected to the Input1:
check_gude.pl -H nc2i2o -k Input1 -w :0 -c :0
expert net control 2i2o 2100/2150: OK – OK: Input1=0 (w::0, c::0)
check_gude.pl -H nc2i2o -k Input1 -w :0 -c :0
expert net control 2i2o 2100/2150: CRITICAL – CRITICAL: Input1=1 (w::0, c::0)
Everything between 215V and 235V is OK:
check_gude.pl -H powercontrol -k Voltage1 -w 215:235 -c 210:240
Expert Power Control 1100: OK – OK: Voltage1=230V (w:215:235, c:210:240)
Test port state:
check_gude.pl -H powercontrol -k PortState1 -w :0 -c :0
Expert Power Control 1100: CRITICAL – CRITICAL: PortState1=1 (0=off, 1=on) (w::0, c::0)

OSMC2011 Eröffnung

Die diesjährige Open Source Monitoring Conference ist eröffnet. Bernd hat die Teilnehmer auf die kommenden Vorträge und die Abendveranstaltung eingestimmt und die Gelegenheit der Eröffnungsrede genutzt um kurz InGraph vorzustellen.
Die Vorträge laufen wie immer parallel in zwei Sälen. Den ersten Vortrag im größeren der beiden, “Performance-Vergleich von Nagios Monitoring Lösungen” von Christoph Siess habe ich mir angehört.
Es werden die aktuellen Monitoringlösungen/Komponenten mit Nagiosbezug (Nagios, Icinga, Shinken, mod_gearman, Merlin) im Hinblick auf ihre Performance und Skalierbarkeit verglichen.
Ausgeklammert wurden der embedded Perl Interpreter, und Performance Daten.
Die Ergebnisse sind sehr interessant:
– beim Nagios 3.2.1 steigt die Latenz ab einer bestimmten Zahl von Checks sprunghaft an. Die Dauer der Checks wirkt sich merklich auf die Latenz aus. Störungen (also nicht OK Checks) wirken auch negativ auf die Latenz. (Latenz bei 2200 checks 7s)
– im Vergleich dazu Nagios mit mod_gearman (Latenz 0.5s)
– Shinken (Latenz 0.9s)
– Icinga, Nagios und Merlin verhalten sich nahezu identisch.
– Merlin profitiert von weiteren Nodes zur Lastverteilung.
– mod_gearman profitiert von Worker Prozessen die die Checks ausführen
Leider bleiben einige Fragen offen.
– Wie wirkt sich das anhängen der NDO bzw. IDO aus?
– Welche Wirkung haben Performance Daten?
Wir freuen uns auf zwei spannende Tage hier in Nürnberg