Seite wählen

NETWAYS Blog

Project of the month: Centrally controlled yet independent distributed monitoring

November 2009: Offering media services in over 30 languages, the internationally acclaimed Deutsche Welle was seeking to monitor their equally diverse IT. Large and distributed across two offices in Bonn and Berlin, the broadcaster needed to consolidate their disparate monitoring activities into one enterprise system. A central overview was essential, as was exceptionally high availability. Deutsche Welle offered NETWAYS the opportunity to suggest a solution- and an innovative one was proudly delivered.
Since monitoring needed to be self sufficient at each location while being centrally accessible, the consulting team designed a multiple redundant system. Two monitoring clusters were implemented in each city and integrated by a single MySQL cluster. In a master/master failover, each database was also physically located in their respective city. This amounted to two physical Nagios servers and one database at each office, which could operate independently if ever a break in connection were to occur. Furthermore, two physical Nagios servers at each location gave additional guarantee of constant availability. By using the MySQL cluster as a kind of interchange hub, monitoring was centralised without compromising operational independence.
DeutscheWelle_distributed_monitoring
Upon implementation, an array of Nagios addons and plugins were also employed. From NSClient++, SNMPTT and NagVis to EventDB, NagiosGrapher and Business Process Addon, Deutsche Welle was fully equipped by the end of the project. All that is left is a few days training to equip the staff with the skills for a similar operational independence.

Project of the month: Nagios to Oracle, SAP and AIX quick

buw_logoOctober 2009: When Bormann und Wulf from BuW first looked into Nagios they were looking for a quick and easy solution, out of the box. Upon meeting NETWAYS however, they decided against an appliance which promised plug and play monitoring for flexibility and independence in customization. After a streamline consulting visit from William to assist in system conception, the team at BuW were on their own till just this month.
They came this time to NETWAYS with a standard request – extend Nagios and quickly please. And this is what they got. Birger’s visit was short and smooth with all bases covered. From monitoring their Oracle and SAP clusters to AIX and installing EventDB and SNMP Trap Translator, all were integrated into a monitoring solution without a glitch.
The record speed project however, was only possible thanks to the fantastic coordination of the team at BuW. Upon Birger’s entrance to their Nagios scene, BuW already had good Debian foundations, an installed Oracle client, access rights and users set, as well as checks in CCMS for SAP fixed. With both sides well prepared, the entire project was achieved as fast as if it came straight out of the box.

Technikworkshop Herbst 2009

Zweimal im Jahr kommen in großer Runde zusammen, um Neuerungen des Developments und gewonnene Erfahrungen aus den Projekten zu diskutieren und Neuerungen auszutauschen.


Heute war es mal wieder soweit und wir haben uns nach einem gemeinsamen Frühstück den aktuellen Themen rund um Nagios und Icinga gewidment:

  • Neuerungen und K0nfiguration im NETWAYS Grapher V2
  • Vorstellungen check_interface_table
  • Voice Alarmierung auf Basis von Starface und NoMa
  • LConf – LDAP basierte Konfiguration in großen Projekten
  • Einsatz eines Open Source ESB in verteilten Umgebungen

Wir freuen uns auf die anstehende Monitoring Conference und wünschen allen Bloglesern ein schönes Wochenende.

Bernd Erk
Bernd Erk
CEO

Bernd ist Geschäftsführer der NETWAYS Gruppe und verantwortet die Strategie und das Tagesgeschäft. Bei NETWAYS kümmert er sich eigentlich um alles, was andere nicht machen wollen oder können (meistens eher wollen). Darüber hinaus startete er früher das wöchentliche Lexware-Backup, welches er nun endlich automatisiert hat. So investiert er seine ganze Energie in den Rest der Truppe und versucht für kollektives Glück zu sorgen. In seiner Freizeit macht er mit sinnlosen Ideen seine Frau verrückt und verbündet sich dafür mit seinen beiden Söhnen und seiner Tochter.

Project of the month: A check plugin to check checks

T-Mobile_logoJuly 2009: With over 200 services checks on each of their many hosts, T-Mobile admins were receiving more than the average barrage of alerts. As with any large and complex environment, too much detail can be counter productive.
So a plugin was needed, which could gauge a critical level of alerts for a specific service type. In effect it would summarise checks at Critical/Unknown, Warning, OK levels, and send an alert only once a significant level was reached. Check_cluster was unworkable, as it required each of the 200+ service names to be configured.  Check_multi was also inappropriate for the very same reason – too much unnecessary configuration work.
Beyond evaluating a critical level, the plugin needed to prioritise groups of service groups between hosts, sending a higher alert for group fallouts. Flexibility was naturally also important; it had to allow T-Mobile to arbitrarily choose the monitored service checks by service group or by regular expression on the service name. To top it off, the plugin would also need to integrate into their new NETWAYSGrapherv2.
Within 10 days, Birger presented check_ndo.pl, to meet all these needs. By calling up the Nagios database, the plugin could not only filter service groups but also retrieve status information, making it an simple, elegant piece of code. And the good news is, he will release it soon for all to download under GPL at www.MonitoringExchange.org. We’ll keep you posted.

Pimp My Nagios

gkss
Ein GKSS Mitarbeiter hat unserem Consulting-Einsatz bei der  GKSS-Forschungszentrum Geesthacht GmbH diesen Titel verliehen. Soetwas bleibt irgendwie im Gedächtnis hängen. 🙂
GKSS ist Mitglied der Helmholtz-Gemeinschaft Deutscher Forschungszentren, der größten deutschen Wissenschaftsorganisation und leistet mit drei Instituten Forschungs- und Entwicklungsarbeiten in den Bereichen Küsten-, Polymer- und Werkstoffforschung. Den Instituten steht sogar ein eigener Forschungsreaktor zur Verfügung.
Durch unsere Mithilfe wurde die bei GKSS vorhandene Nagios Konfiguration stark vereinfacht. So wurde beispielsweise die Konfigurationdatei der Servicedefinitionen dank Templates und Vererbungen um satte 80 % gekürzt, worunter aber keine einzige Überwachung leiden musste. Im Gegenteil. Es wird nun sogar detaillierter überwacht. Eine weitere, starke Vereinfachung ist Noma zu verdanken. Unserem Notification Manger für Nagios. Noma löste eine sehr detailliert konfigurierte Benachrichtigung ab. Nun können Kontakte und Notifications bequem durch das Noma Webinterface gepflegt werden.
Wir bedanken uns bei GKSS für die sehr produktive Zusammenarbeit und freuen uns nätürlich wenn wir in Zukunft weiterhin unterstützen können.

Tobias Redel
Tobias Redel
Head of Professional Services

Tobias hat nach seiner Ausbildung als Fachinformatiker bei der Deutschen Telekom bei T-Systems gearbeitet. Seit August 2008 ist er bei NETWAYS, wo er in der Consulting-Truppe unsere Kunden in Sachen Open Source, Monitoring und Systems Management unterstützt. Insgeheim führt er jedoch ein Doppelleben als Travel-Hacker und renoviert, baut und bastelt als Heimwerker an allem was er finden kann.