NETWAYS Event Services GmbH
Deutschherrnstraße 15-19
90429 Nürnberg

Phone:
+49 911 92885-0
Fax:
+49 911 92885-77
Email:
events(at)netways.de

Kontaktformular

Hier finden Sie alle Videos and Slides der OSMC 2013:

Holger Koch | 10 Jahre Monitoring mit Open Source Software bei der DB Systel (DE)

Der Vortrag bietet im ersten Teil einen Überblick über die Anfänge. Dabei wird sowohl auf die verwendete Technik und Architektur, als auch auf die kulturellen Probleme bei der Einführung eingegangen.
Im zweiten Teil des Vortrags wird erläutert, warum und wie es die DB Systel geschafft hat aus einer Updatefalle auszubrechen und wie die Migration auf eine moderne Icinga basierte Monitoringplattform gelungen ist.

Reiko Streng | Monitoring-Landschaft auf Basis von OMD (DE)

it@m betreibt als zentraler IT-Dienstleister die gesamte heterogene Landschaft der Landeshauptstadt München mit ca. 1500 Hosts und 15000 Services. Um den wachsenden Anforderungen und Ansprüchen gerecht zu werden, wurde eine komplette Überarbeitung und Neustrukturierung des bestehenden Monitoring durchgeführt.
Der Vortrag beschreibt die Monitoring-Landschaft auf Basis von OMD, welche mittels Mod-Gearman verschiedenste Aufgaben (PNP4Nagios, dedizierte Plugin-Worker, ...) auf einzelne Worker auslagert und somit eine fließende Skalierbarkeit gewährleistet. Die notwendige Konfiguration wird mehrmals täglich automatisch aus verschiedenen Quellen (u.a. CMDB) generiert und mit Hilfe von GIT revisionssicher dem Nagios-Core bereitgestellt.
Die Landeshauptstadt setzt hierzu im gesamten Projekt auf Opensource Produkte.

Thomas Lehmann | Monitoring als Quelle der Wahrheit im Wellendeployment einer dynamischen Webseite (DE)

ImmobilienScout24 betreibt fast 2.000 Server Instanzen mit 160 Applikationen, die von 100 Entwicklern erweitert und von 30 Admins betreut werden, so dass sich Systemänderungen quasi im Stundentakt ergeben. DevOps Mindset, Automation, Continuous Delivery, Sprengfestigkeiten und das konsequente Stagen aller Changes sind Themen die uns bewegen.
Die zentrale Komponente zur Datenspeicherung und Auswertung bei ImmobilienScout24 ist Graphite, welches alle Monitoring Informationen enthält. Diese Komponente wird aktiv von Icinga ausgewertet und mit konfigurierten Schwellwerten verglichen. Ziel ist die clientbasierte Konfiguration des Icinga Alarmings, durch Rollout der entsprechenden Werte auf den Client
Die Erweiterung unseres Monitoring zur Quelle der Wahrheit im Wellendeployment ist das aktuelle Ziel. Das Icinga Alarming überwacht Instanzen während des Deployment, beeinflusst den Verlauf des Wellenrollout durch unsere Open Source Lösung YADT und informiert die Anwendungsbetreuer bei Fehlern. Da wir hierbei immer wieder an die Konzept- und Leistungsgrenze bestehender OpenSource Lösungen stoßen, entwickeln wir diese zusammen mit den Projekt-Maintainern upstream weiter und stellen diese der Open Source Community zur Verfügung.
In dieser agilen Welt ein verlässliches und umfassendes Monitoring und Alarmsystem zu bauen ist Inhalt dieses Talks.

Johannes Egger | Enterprise Platforms Monitoring at s IT Solutions AT (DE)

Der Geschäftsbereich Enterprise Platforms des IT Dienstleisters s IT Solutions AT betreibt für die Erste Group eine große Anzahl an Systemkomponenten in den Bereichen UNIX, Windows, Applikationen, Datenbanken, Virtualisierung, Storage- und Hardware-Management. Für die Überwachung dieser Systemkomponenten kommt eine Icinga-Umgebung zum Einsatz. Derzeit werden etwa 46000 Host- und Servicechecks auf einer Umgebung durchgeführt, welche für 65000-80000 checks ausgelegt ist, Tendenz steigend.
Im Vortag wird ein Migrationsprojekt von Tivoli Endpoints auf Icinga mit Schwerpunkt auf die Probleme in Zusammenhang mit einer großen Icinga-Installation geschildert. Wesentliche Merkmale sind die (Teil-)Automatisierung der Konfigurationsgeneration aus der CMDB, die Zuordnung von Hosts zu verschiedenen Hostgruppen anhand unterschiedlicher Kriterien, die Automatisierung des deployments von Agents und Plugins sowie die Schnittstelle zum übergeordneten, unternehmensweiten Umbrella Monitoring.

Bernd Strößenreuther / Sascha Brechmann | Puppet konfiguriert Nagios automatisch (DE)

Teil 1: Grundlagen
Immer dann, wenn ein neuer Server aufgesetzt wird, muss dieser auch ins Monitoring aufgenommen werden (CPU, RAM, Disk, ...).
Immer wenn ein neuer Dienst (z. B. Apache Webserver) auf eine Maschine gebracht wird, ist auch dieser zu überwachen (z. B. mit check_http).
Wer Maschinen und Dienste über Puppet konfiguriert, kann seine Puppet-Module auch so erweitern, dass diese darüber hinaus (über Exported Resources) auch gleich das Monitoring dafür (auf der zuständigen Monitoring-Maschine) mit aufsetzen. Das spart dem Admin Arbeit und stellt sicher, dass kein System mehr im Monitoring vergessen wird.
Mit Puppet und (klassischem) Nagios wird an konkreten Beispielen kurz gezeigt, wie das umgesetzt werden kann.

Teil 2: Puppet / OMD / Nagios / Check_MK im praktischen Einsatz
Es soll aufgezeigt werden, wie bzw. was mit Puppet gemacht werden kann.
Installation des OMD / Check_MK Server. Installation des Check_MK Agent auf den Clients. Automatischen Einbinden inkl. Inventur der Clients auf dem Check_MK Server. Setzen von Check_MK Tags per Facts und innerhalb von Puppet Modulen sowie beim Installieren des Check_MK_Agent. Einbinden von Mod_Gearman zur Lastverteilung und um FW-Grenzen zu überwinden.
Erstellen einer Automatischen Dokumentation im OMD Dokuwiki anhand von Puppet Facts aller VMs. Nutzen von, durch Puppet erstellten TAGs, um zusätzliche aktive Checks zu erzeugen (Check_HTTP; Check_SMTP; usw).

Jeff Gehlbach | What´s New in OpenNMS (ENG)

OpenNMS ist die weltweit erste Open Source Network Management Application Platform für Unternehmen. Erfahren Sie mehr über die Neuheiten von OpenNMS 1.12 und welche Features für OpenNMS 2.0 geplant sind, wie beispielsweise VMWare-Support, topologisches und geographisches Mapping sowie hoch skalierbare Datensammlungen.

Rihards Olups | Zabbix: A Practical Demo (ENG)

Auch wenn es nützlich ist sich einen Überblick darüber zu verschaffen wie ein System funktioniert, versteht man es am besten, wenn das System gerade läuft.
Dieser Vortrag wird ein praktischer Quickstart sein, der aktuelle Basiskonfigurationen von Zabbix zeigen wird, von der Datensammlung bis hin zu Warnmeldungen.

Icinga - Team | Current State of Icinga (DE)

Seit der ersten Preview auf der OSMC 2012 ist viel passiert und Icinga2 hat Gestalt angenommen. Neben verbesserter Performance und flexibler Architektur und zentrales und dezentrales Cluster zeichnet sich Icinga2 vor allem durch vereinfachte Konfiguration aus. Auch bei Icinga1 sowie bei den verschiedenen Add-ons und Webinterfaces hat sich viel getan. Neben einem aktuellen Status gibt der Vortrag einen Überblick über die kommenden Entwicklung und zeigt die aktuellen Versionen in Live Demos.

Alan Robertson | Monitoring and Discovery without Limit (ENG)

Das Assimilation Project bietet integriertes IT Discovery und Monitoring. Discovery arbeitet lückenlos und ohne Network Footprint.
Das Monitoring ist hochskalierbar dank der extrem verteilten Architektur. Discovery informiert das Monitoring – vereinfacht das Konfigurieren und die Wartung. Discovery entdeckt längst vergessene Systeme und Services, die nicht mehr überwacht werden und Abhängigkeiten. Etwa 30 % der äußeren Angriffe, sind auf vergessene Systeme zurückzuführen *_* Was eine große

Luca Deri | Monitoring network traffic using ntopng (ENG)

ntop ist ein Open Source Network Monitoring Projekt fokussiert auf Network Traffic Monitoring. Durch das Aufkommen von modernen Computerarchitekturen und high-speed Netzwerken, mussten viele Komponenten umgestaltet werden, um die neuen Herausforderungen zu meistern. Das Monitoring von 10G-Netzwerken erfordert eine high-speed Paketerfassung/-übermittlung und effiziente Monitoring Applikationen. In den vergangenen Jahren hat ntop etliche Open Source Tools, Kernel Module und flow-basierte Applikationen, um high-speed Traffic Monitoring auf Standard Hardware zu ermöglichen. Dieser Talk wird Ihnen einen Überblick über die Vielzahl an ntop Monitoring Komponenten verschaffen und Ihnen ntopng vorstellen, die neuste Version von ntop. Außerdem werden Use Cases aufzeigen, bei denen sich diese Tools bewährt haben.

Andreas Ericsson | The future of Nagios (ENG)

Oliver Hankeln | openTSDB - metrics for a distributed world (ENG)

Wir bei gutefrage.net messen alles! Ganz nach dem Motto: “what gets measured gets managed". Vom Server Load zu Content Generierung bis hin zu den AdSense-Einnahmen, wird alles ausgewertet.
Um mehr als 100M Datenpunkte für mehr als 2000 Metriken pro Tag zu speichern, benötigen Sie das richtige Tool. Uns gefällt das openTSDB am besten.
In dieser Präsentation werde ich Ihnen einen Überblick über die Architektur von openTSDB verschaffen, es mit anderen Systemen vergleichen, demonstrieren wie einfach es ist neue Metriken zu sammeln und Tipps zur Nutzung des Systems und zur Auswahl der Metriken geben.

Anders Håål | Why dynamic and adaptive thresholds matters (ENG)

Der Vortrag wird zeigen, weshalb Dynamik und anpassungsfähige Thresholds der Schlüssel zur modernen IT und zum Business Monitoring ist.
Die Präsentation wird einige Use Cases aufzeigen, bei denen komplexe Threshold Logics anwendbar sind.

  • Thresholds basierend auf historischen Daten
  • Thresholds basierend auf aggregierte Daten aus unterschiedlichen Service-Performance-Daten und/oder Statusinformationen
  • Thresholds basierend auf der Tageszeit und anderen kalendarischen Profilen
  • Anwendung mathematischer Funktionen wie Durchschnitt, Derivative, Sum, Min, Max etc. um Thresholds zu ermitteln basierend auf Datenreihen

Wir werden Ihnen zeigen, wie wir dies mit Hilfe des Bischeck Open Source Framework (www.bischeck.org), das in Nagios integriert ist, erreicht haben.

Fernando Hönig | Distributed Monitoring and Cloud Scaling for Web Apps (ENG)

Der erste Teil der Präsentation wird zeigen, wie wir Nagios und WebInject in eine verteilte AWS EC2 Monitoring Infrastruktur integriert haben. Dies haben wir mit Hilfe von Event Handlers umgesetzt, die zusätzliche Checks an verschiedenen Punkten Schwellenwerte ermitteln und daraufhin einen Status anzeigen. Außerdem rufen wir verschiedene APIs von anderen Monitoring Tools wie Gomez Networks und Pingdom ab und nutzen deren Feeds. Für Benachrichtigungen haben wir CallWithUs (für VoIP Anrufe) und Clickatell für SMS Alarmierungen mit eingebunden.
Der zweite Teil des Talks wird ausführlich beschreiben, wie Hosts aktiviert und deaktiviert werden, Services von Anlagen die automatisch mit Amazon EC2 erzeugt werden und in der Cloud Infrastruktur autoscalieren. Außerdem werde ich aufzeigen, weshalb Host Gruppen so wichtig sind sowie deren kundenspezifische Implementierung. Im Anschluss werden Sie sehen wie Nagvis in Nagios mittels mklive_status broker intergiert wurde, um viele tolle Abbildungen zu erstellen, vor allem automatisch. Dabei werde ich Ihnen zeigen, wie einfach es ist verschiedene Nagios Systeme in einer Abbildung zusammenzufassen, um ein ganzheitliches Bild unseres Systems zu bekommen.

Georg Kostner | End User Experience Monitoring with Al'exa (ENG)

Der erste Teil der Präsentation wird zeigen, wie wir Nagios und WebInject in eine verteilte AWS EC2 Monitoring Infrastruktur integriert haben. Dies haben wir mit Hilfe von Event Handlers umgesetzt, die zusätzliche Checks an verschiedenen Punkten Schwellenwerte ermitteln und daraufhin einen Status anzeigen. Außerdem rufen wir verschiedene APIs von anderen Monitoring Tools wie Gomez Networks und Pingdom ab und nutzen deren Feeds. Für Benachrichtigungen haben wir CallWithUs (für VoIP Anrufe) und Clickatell für SMS Alarmierungen mit eingebunden.
Der zweite Teil des Talks wird ausführlich beschreiben, wie Hosts aktiviert und deaktiviert werden, Services von Anlagen die automatisch mit Amazon EC2 erzeugt werden und in der Cloud Infrastruktur autoscalieren. Außerdem werde ich aufzeigen, weshalb Host Gruppen so wichtig sind sowie deren kundenspezifische Implementierung. Im Anschluss werden Sie sehen wie Nagvis in Nagios mittels mklive_status broker intergiert wurde, um viele tolle Abbildungen zu erstellen, vor allem automatisch. Dabei werde ich Ihnen zeigen, wie einfach es ist verschiedene Nagios Systeme in einer Abbildung zusammenzufassen, um ein ganzheitliches Bild unseres Systems zu bekommen.

Oliver Tatzmann | Zielgruppenorientiertes IT Servicemonitoring (DE)

Die Informationen aus dem Monitoring sollen nicht nur Administratoren zur Verfügung stehen, sondern auch Personen mit weniger technischen Hintergrund (Serviceowner, Management, Enduser).
Es geht darum die Anforderungen der unterschiedlichen Zielgruppen aufzunehmen, zusammenzufassen, umzusetzen und am Ende die Daten für alle Zielgruppen zur Verfügung zu stellen.
Beginnend beim Monitoring einer einzelnen Komponente bis zur Berücksichtigung von komplexen System.
Im Vortrag werden die praktischen Erfahrungen bei der Erhebung der Anforderungen behandelt, sowie die Umsetzung mit Nagios/Icinga und standard AddOns anhand eines global verfügbaren Services gezeigt.

Bernd Erk | Log- und Eventmanagement (DE)

Das Handling von passiven Events und deren Korrelation gehört nicht gerade zu den großen Stärken von Nagios und Icinga. Natürlich ist es mit Hilfe verschiedener Plugins und Addons möglich unterschiedlichste Quellen zu überwachen und auszuwerten, eine regelbasierte Verarbeitung und Langzeitspeicherung gestaltet sich jedoch meist schwierig.
Um eine lückenlos nachvollziehbare Kette an Logs und Events von Entstehung bis zur Speicherung sicherzustellen, stehen diverse Open Source Lösungen zur Verfügung. Werkzeuge wie Logstash, EDBC und statsd genießen in den letzten Monaten größer werdende Beliebtheit, werden jedoch häufig isoliert konfiguriert und betrieben. Die große Herausforderung besteht darin, die vorhandenen Werkzeuge miteinander zu verbinden um die individuellen Stärken optimal zu nutzen.
Neben einer Einführung in die verwendeten Tools, demonstriert der Vortrag eine konkrete Implementierung der beschriebenen Komponenten und deren Anbindung an Nagios und Icinga. Dies geht von der Installation und Konfiguration bis hin zu erweiterten Filter- und Korrelationsregeln.

Sven Nierlein | Thruk - Monitoring GUI (DE)

Thruk ist eine Web-Gui welche mehrere Nagios, Icinga und Shinken Instanzen über Livestatus übersichtlich darstellen kann. Es wurde entwickelt um die Nagios CGIs durch eine performante Alternative zu ersetzen und bietet über die Standardfeatures hinausgehend auch Addons für Reporting, Dashboards, Konfiguration und Mobile Support sowie etliche Kleinigkeiten welche die tagtägliche Arbeit mit Nagios schöner machen.
Der Vortrag gibt eine Übersicht über Thruk, Tipps und Tricks bei der Installation und Handhabung sowie einen Überblick vorhandener Erweiterungen und Plugins.

Michael Medin | Making monitoring simple? (ENG)

In diesem Vortrag wird der neue vereinfachte Monitoring Agent NSClient++ vorgestellt. Mit der kommenden 0.4.2 Release von NSClient++ wird es nun endlich ein neues Check Subsystem geben, welches nicht nur auf aktuellen Windows-Systemen laufen, sondern dabei auch noch sehr schnell sein wird. Der Vortrag zeigt die neue vereinfachte Syntax sowie das Real-Time-Monitoring über alle Kommandos von NSClient++ hinweg. Ergänzend wird es Updates an der Linuxfront und dem agentenlosen Monitoring geben.

Pall Sigurdson | Adagios- Web configuration done right (ENG)

Adagios ist ein Nagios/Icinga Add-on, das die Konfiguration des vorhandenen Nagios ohne Datenbank-Backend ermöglicht. Es bietet ein Web-API, funktionsreiche Konfigurationen, ein integriertes Status Interface, das automatisch die Schnittstelle zwischen PNP und mk-Live Status bildet.
Dieser Vortrag wird die Herausforderungen aufzeigen, die die Wartung einer großen Monitoring Umgebung beansprucht und wie Adagios und das ihm zugrundeliegende Tookit pynag dazu beitragen können ein modernes Monitoring System zum Laufen zu bringen.

Birger Schmidt | Flapjack - monitoring notification system (ENG)

Flapjack flapjack-project.com setzt auf etablierten Monitoring Systemen auf und ermöglicht es, diese zu einem hoch skalierbaren Gesamtsystem aufzubauen.
Flapjack verarbeitet Monitoringergebnisse zu Benachrichtigungen. Damit werden Überwachung und Benachrichtigung entkoppelt.
Beispielsweise kann ein Mix aus verschiedenen Nagios-, Icinga- und Sensu-Instanzen checks ausführen und die Ergebnisse an Flapjack zur Verarbeitung weitergeben. Flapjack generiert daraus die Benachrichtigungen, die anschließend via PagerDuty, XMPP, E-Mail oder SMS zugestellt werden.
Die Funktionalität von Flapjack steht dank der API für andere Komponenten zur Verfügung.
Der Vortrag gibt Einblick in Motivation, Historie, Hintergründe und technischen Aufbau der Software.

Gerhard Laußer | coshsh - Generationen von Konfigurationen (DE)

Das Framework coshsh ist 2011 entstanden, um automatisiert Nagios-Konfigurationsfiles zu erzeugen. Als Datenquellen können beliebige CMDBs und sonstige Inventarlisten verwendet werden. Aus den vorgefundenen Objekten (Hosts und installierte Applikationen) erzeugt coshsh mit Hilfe von Regeln und Vorlagedateien die endgültigen Konfigurationen. Besonderer Wert wird darauf gelegt, dass auf der Eingabeseite kein Monitoring-KnowHow vorhanden sein muss, dass also Windows-Admins, DBAs etc. ihre Systeme auf einfache Weise registrieren können. Das Spezialwissen und welche Services letztlich entstehen, steckt in besagten Regeln und Vorlagen.
Im Vortrag wird die Bedienung von coshsh durch Monitoring-Admins erklärt und gezeigt, in welchen Umgebungen das Tool mittlerweile seinen Dienst verrichtet.

Werner Fischer | TKmon - easy web-based configuration of Icinga (ENG)

Icinga und Nagios sind zwei sehr bekannte und von nahezu allen Linux Sysadmins weltweit verwendete Monitoring Systeme. Für Sysadmins jedoch, die mit anderen Betriebssystemen arbeiten, war es in der Vergangenheit schwierig ein Linux System zu installieren und Icinga darauf so zu konfigurieren, dass ein vernünftiges Monitoring des Netzwerks möglich war.
Um diesem Problem Abhilfe zu schaffen, entwickelten NETWAYS und Thomas Krenn ein bedienerfreundliches Web Front-End, das es jedem Sysadmin ermöglicht Icinga unkompliziert zu konfigurieren und anzuwenden.
Haupt-Features von TKmon sind unter anderem die Anzeige des aktuellen Servicestatus und die Einrichtung von Hosts, Services und Kontakten. Der erweiterbare Servicekatalog erlaubt die Definition von Services, sodass sie optionale Parameter unterstützen, die über das TKmon Webinterface eingegeben werden.
Zusätzliche Features von TKmon sind: Netzwerkkonfigurationen, Mailkonfigurationen, Security Konfigurationen (Öffnung/Sperrung direkter Zugänge zu Icinga oder SSH) und Backup/Restore Funktionen für die gesamte Konfiguration.
TKmon wurde unter der GPL-Linzenz auf dem diesjährigen LinuxTag im Mai released. Seither sind einsatzbereite TKmon Pakete für Ubuntu 12.04 LTS im Thomas Krenn Repository archive.thomas-krenn.com. verfügbar. Ein ISO Image, um Ubuntu 12.04 basierend auf einer TKmon Appliance zu installieren, ist auch in Planung und sollte zur OSMC bereits verfügbar sein.
Jetzt gibt es also keinen Grund mehr, weshalb Windows Sysadmins Icinga nicht verwenden sollten;-)
Weitere Informationen zu TKmon finden Sie unter: www.thomas-krenn.com/en/wiki/TKmon

Martin Fürstenau | check_vmware_esx.pl - ein Rewrite von check_vmware_api.pl (DE)

Die Geschichte von einem, der auszog das fürchten zu lernen oder Warum ein Rewrite von check_vmware_api.pl?
Die Überwachung von vmware ist in der Nagios/Icinga Landschaft ein ziemlich schwarzes Loch. Das am meisten verbreiteteste Plugin check_vmware_api.pl(früher check_esx3.pl) hat schon manchen Admin zur Verzweiflung getrieben. Die Hilfe ist nicht immer ganz einfach zu verstehen, einiges ist nicht dokumentiert und bei anderen Optionen wird deren Sinn nicht klar. Die Codestruktur macht Änderungen und Ergänzungen nicht trivial und ist mit 4600 Zeilen auch kein Kleinkram. Auslöser des Rewrites war das Storage Monitoring. Bei Dutzenden von LUNs war die Ausgabe des Plugins einfach unbrauchbar. Hinzu kamen entdeckte Fehler und das Nichtausschöpfen von Möglichkeiten. Da die Umsetzung von Änderungsvorschlägen eher zurückhaltend erfolgt, fiel die Entscheidung für einen Fork und ein Rewrite.
Der Vortrag zeigt den Stand der Dinge, erklärt was weshalb entfallen ist, und wo Performancecounter einfach entweder falsch interpretiert werden, oder vom Anwender des Plugins falsch interpretiert werden können und ab wann das Plugin zur Verfügung steht.