Weekly Snap: Cloud & SLA, OSMC & NSCA

18 – 22 June looked at the cloud and development models, offered a guide to NSCA and counted down to the OSMC.
In charge of our cloud and a OpenNebula fan, Sebastian was proud to see Netways featured on OpenNebula’s list of users.
On the same theme, Bernd considered SLA in the cloud, upon learning of Amazon Web Services’ availability woes.
Following on, Alexander clarified the software development concepts within and around Model Driven Architecture, while Philip continued his NSClient++ series with part 7 on NSCA.
As usual Eva counted down to the OSMC (121 days) with a video of Oliver Jan’s presentation on “Monitoring Solutions for the Next Decade.”

SLA in der Cloud – Es ist nicht alles Gold was glänzt

Es ist eher Zufall das ich an Sebastians Cloud-Post vom letzten Dienstag anknüpfe, aber ich hatte es mir bereits am Montag vorgenommen. Vor einigen Tagen war bei Heise zu lesen, dass Amazon ein paar Schwierigkeiten mit einem Teil, Amazon nennt es AWS-Verfügbarkeitszone, des Datacenters in Virginia hatte. Amazon selbst beschreibt die Details auch ausführlich im entsprechenden RSS-Feed der Teil des Status-Monitors ist.
Der ein oder andere wird mit dem Status-Monitor und den zugrunde liegenden Informationen schon überfordert sein, aber die Transparenz möchte ich Amazon nicht vorwerfen. Hinzu kommt das die Kollegen ihren Laden mit Sicherheit im Griff haben und der ein oder andere Vortrag zum Thema hat mich schon von Amazons Können überzeugt. Vielmehr finde ich spannend wie Service aber auch Verfügbarkeit nach Außen definiert werden. Der Begriff Cloud-Services, die bei Amazon übrigens Web-Services heissen, muss im Moment ja nahezu für jeden IP-basierten Dienst herhalten, dessen Pakete beim Routing das eigene Firmengebäude verlassen. Ob Spotify, Dropbox oder iCloud, nahezu alles ist immer und überall erreichbar und ich muss mich um nichts mehr kümmern. Was ist aber wenn ich mich dafür entschieden habe meine Services in die “Cloud” zu verlagern? Wie funktioniert das? Kann meine Anwendung das überhaupt?
Genau das ist nämlich die spannende Frage in der sich Vorstellung und Realität oft nicht die Hand geben. Gerade bei Amazon besteht das Angebot aus verschiedenen Diensten wie EC2, S3, Cloud Watch und allem möglichen anderen. Cloud-Services verwenden heisst nämlich eine Applikation aus verschiedenen Service-Komponenten zusammenzubauen und Internet-Dienste für DB, Routing oder Loadbalancing zu verwenden. Mit Services wie CloudWatch kann man die gebuchten Ressourcen dann auch überwachen und bei Bedarf Ressourcen hinzufügen.
Was aber passiert wenn Hardware im Rechenzentrum ausfällt? Die Antwort ist einfach. Nix!
Ich möchte niemanden desillusionieren, aber auch Cloud-Dienste laufen auf echter Hardware, die von Zeit zu Zeit mal den Geist aufgibt. Wenn das passiert kann ich mich informieren lassen und ggf. per Hand einen Ec2 Snapshot neu starten, von selbst jedoch passiert dort reichlich wenig. Die Kunden können sich durch die Online-Hilfe wühlen und schauen wie sie die entsprechenden Volumens wieder aus einem Snapshot recovern und die gebuchten Ressourcen online bringen. Ist ja eigentlich auch logisch dass man dort nicht alles für den Kunden machen kann, da man die Applikation ja nicht kennt und keine Ahnung hat, was wie zusammengehört.
Besonders spannend finde ich zwei Punkte aus der SLA-Definition zur Beschreibung der Verfügbarkeit und der daraus resultierenden Gutschriftsregelung:

  • Jeder Ausfall unter fünf Minuten ist nicht SLA-Relevant
  • Unavailable ist das System nur dann, wenn mind. zwei Availability Zones in denen man Systeme eingestellt hat nicht verfügbar sind

Was das bedeutet kann sich jeder selbst ausrechnen und aus meiner Sicht ist der SLA auch nicht verwerflich. Ob ich mich jedoch hinter dem Paperwork herauswagen und meine Gutschriftsregelung durchsetzen kann, wage ich zu bezweifeln. Einfach dargestellt bedeutet das für den Kleinanwender aus meiner Sicht einfach nur, dass man nix bekommt und auch keine Verfügbarkeitseinbusse besteht.
Wir messen uns täglich an den Herausforderungen im eigenen Rechenzentrum und es passieren auch Fehler. Sei es nun verursacht durch uns, den Kunden oder durch beide Seiten. Die besonderes spannende Mehrwert den wir aber den Kunden hier bieten ist das Wissen über Ihre Geschäftsmodell, Abhängigkeiten, Ansprechpartner und alldem was einen Kunden speziell macht, wenn man IP, Strom und Rackspace als Voraussetzung annimmt. Da kann ich mich nicht mit dem Angebot in der Wolke messen, sondern bin einfach besser!

Bernd Erk
Bernd Erk
CEO

Bernd ist Geschäftsführer der NETWAYS Gruppe und verantwortet die Strategie und das Tagesgeschäft. Bei NETWAYS kümmert er sich eigentlich um alles, was andere nicht machen wollen oder können (meistens eher wollen). Darüber hinaus startet er das wöchentliche Lexware-Backup und investiert seine ganze Energie in den Rest der Truppe und versucht für kollektives Glück zu sorgen. In seiner Freizeit macht er mit sinnlosen Ideen seine Frau verrückt und verbündet sich dafür mit seinem Sohn.

NETWAYS Schulungen – Entscheidung leicht(er) gemacht!


Für das kommende Jahr haben wir den Ausbau unseres Schulungsangebots geplant und daher bereits zum Start ins Jahr 2012 einige Neuerungen zu vermelden.
Entscheiden Sie selbst wann und wo Sie Ihr Know-How updaten möchten:
Icinga Availability Monitoring, Nagios Availability Monitoring und Puppet Configuration Management laden mit ihren Terminangeboten nun nicht mehr “nur” nach Nürnberg ein. So lockt beispielsweise unsere Icinga und Nagios Schulung nun auch nach Düsseldorf und deckt damit erstmals auch den Nord-Westen Deutschlands ab.
Mit dem Puppet-Lehrgang verschaffen Sie sich jetzt zusätzlich auch in Zürich einen umfassenden Überblick über das bekannte Configuration Management Tool.
Auch bei unserer SLA Reportig Schulung gibt es Änderungen. Zwar wird diese vorerst in Nürnberg verbleiben, aber sie findet nun in neuer Umgebung, nämlich unserer zweiten Schulungslocation, dem Park Inn Hotel Nürnberg, statt.
Bei aller Innovation bleiben wir unseren Grundsätzen natürlich treu:
Intensive Wissensvermittlung in kleinen Gruppen, sowie der Austausch der Kursteilnehmer untereinander stehen bei unseren Schulungen immer an erster Stelle. Erfahrene und kompetente Dozenten, die sich in unzähligen Praxiseinsätzen beim Kunden vor Ort bewährt und ihre Kompetenz in den ausgefallensten Systemen unter Beweis gestellt haben, geben ihr Wissen in gewohnt lockerer, angenehmer, aber immer ergebnisorientierter Atmosphäre weiter.
Rund um Open Source in den Bereichen Systems Management und Data Center Lösungen wird NETWAYS durch die Erweiterung des Schulungsangebots im neuen Jahr etliche zusätzliche Möglichkeiten bieten, umfassendes und profundes Praxiswissen zu erwerben. Alle Informationen zu den neuen Schulungsorten, den nächsten Terminen, sowie die derzeit in Planung befindlichen neuen Schulungsthemen, sind auf unserer Webseite zu finden.

Markus Neder
Markus Neder
Head of Events & Training

Nach langen Jahren im Hotelgewerbe, hat sich Markus auf die andere Seite geschlagen und leitet nun bei NETWAYS die Event-Abteilung. Seine langjährige Erfahrung als Hotelmeister hilft uns jedes Jahr die beste Konferenz von allen die noch kommen werden zu veranstalten. Wenn er privat nicht mit seinen Kindern unterwegs ist, entspannt er am liebsten bei der Gartenarbeit oder beim Gitarrespielen.

Noch 45 Tage…

bis es wieder heißt: meet | discuss | experience
Zusätzlich zu unserem – wie immer –  zweisprachigen Vortragsprogramm der Open Source Monitoring Conference werden in diesem Jahr tags zuvor drei Intensiv-Workshops angeboten, die individuell zur Konferenzteilnahme hinzu buchbar sind.  Wir freuen uns ganz besonders, dass die limitierten Plätze unserer Workshops so heiß begehrt sind! So ist der Workshop „SLA Reporting“ bereits seit einigen Wochen komplett ausgebucht und auch bei den beiden Alternativen „Icinga Kickstart“ und „Konfigurationsmanagement mit Puppet“ sind nur noch sehr wenige Plätze frei. Für den, der sich noch eine Teilnahme sichern will heißt es daher nun: schnell sein und buchen!
Allen Interessenten, die sich in diesem Jahr keine Teilnahme mehr sichern konnten oder  können, empfehlen  wir unser themenspezifisches  Schulungsangebot:
Das NETWAYS Open Source Klassenzimmer bietet noch in diesem Jahr zwei weitere Gelegenheiten, um Expertenwissen zu den Themen „SLA Reporting“ und Puppet Configuration Management“ zu erlangen, die Schullungen werden jeweils im Dezember stattfinden. Mehr dazu hier.
Für das  kommende Jahr haben wir unser Schulungsangebot erweitert und freuen uns, Ihnen dann unter anderem unsere neuen Schulungen in Zürich vorstellen zu können.  Ausführliche Informationen zu allen Themen und Terminen finden Sie auf unserer Website.
Wann dürfen wir Sie im NETWAYS Open Source Klassenzimmer begrüßen?

Markus Neder
Markus Neder
Head of Events & Training

Nach langen Jahren im Hotelgewerbe, hat sich Markus auf die andere Seite geschlagen und leitet nun bei NETWAYS die Event-Abteilung. Seine langjährige Erfahrung als Hotelmeister hilft uns jedes Jahr die beste Konferenz von allen die noch kommen werden zu veranstalten. Wenn er privat nicht mit seinen Kindern unterwegs ist, entspannt er am liebsten bei der Gartenarbeit oder beim Gitarrespielen.

Jasper Reporting – Zusammenfassung

Jasper-ReportingIn den letzten Wochen habe ich mich an dieser Stelle ausführlich mit Jasper-Report beschäftigt. Da wir Jasper stark zunehmend in unseren Kundenprojekten einsetzen auch im Bereich Managed Service  darauf zurückgreifen, lag die Serie sehr nah und ich hoffe soweit die wichtigsten Kernaspekte getroffen zu haben.
Hier nochmals die verschiedenen Posts zum Thema im Überblick:

An dieser Stelle Danke für das positive Feedback und dem starken Interesse an der Serie und dem Thema Reporting. Hier sei auch nochmals auf die NETWAYS Reports auf netways.org hingewiesen. Sollten Fragen offen geblieben sein, so freue ich mich über Kommentare oder Gespräche auf der Open Source Monitoring Conference nächste Woche.
Alle Beispielreports befinden sich auch auf dem Demo-System und können dort gegen unser Nagios-Demo-System gestartet werden.

Bernd Erk
Bernd Erk
CEO

Bernd ist Geschäftsführer der NETWAYS Gruppe und verantwortet die Strategie und das Tagesgeschäft. Bei NETWAYS kümmert er sich eigentlich um alles, was andere nicht machen wollen oder können (meistens eher wollen). Darüber hinaus startet er das wöchentliche Lexware-Backup und investiert seine ganze Energie in den Rest der Truppe und versucht für kollektives Glück zu sorgen. In seiner Freizeit macht er mit sinnlosen Ideen seine Frau verrückt und verbündet sich dafür mit seinem Sohn.

Jasper Reporting – Host Availability

Jasper-ReportingBisher haben wir uns lediglich den Konfigurationsdaten und dem aktuellen Status der Systeme gewidmet, aber wirklich spannend ist bei der Erstellung ja der Blick in die Vergangenheit und im Idealfall dann noch der Überblick über einen bestimmten Zeitraum.
Da die Verfügbarkeitsreports innerhalb von Nagios auf Filebasis erfolgen, müssen die Einträge in der Datenbank erst aufbereitet werden, vorausgesetzt man möchte sich nicht selbst darum kümmern.
Um eine Durchschnittsaussage über einen größeren Zeitraum durchzuführen, müssen die einzelnen Statuswechsel und die Zeiträume dazwischen analysiert und summiert werden. Das ganze kann mit Hilfe unseres Packages netMySLA erfolgen, dass genau diese Informationen in einem nächtlichen Batch ermittelt und in entsprechenden Aggregatstabellen speichert. Nach Installation dieses Packages kann unsere Abfrage wie folgt erweitert werden:

select c.alias,
  a.host_object_id,
  a.display_name,
  a.address,
  e.sla_availability_percent,
  e.sla_outage_percent,
  e.sla_period_identifier,
  d.current_state
from nagios_hosts a,
  nagios_hostgroup_members b,
  nagios_hostgroups c,
  nagios_hoststatus d,
  np_aggregate_sla e
where a.host_object_id = b.host_object_id
and b.hostgroup_id     = c.hostgroup_id
and a.host_object_id   = d.host_object_id
and a.host_object_id   = e.sla_host_objectid
and a.instance_id      = 1
and b.instance_id      = 1
and c.instance_id      = 1
and d.instance_id      = 1
and e.sla_service_name is null
and e.sla_period_name = 'month'
and e.sla_period_identifier > '2009-06-01'

Das Datum ist hier fälschlicherweise fest Codiert und muss in Realität entweder parametrisiert oder via Datums-Parameter gefüllt werden. Mit diesem Statement bekommen wir anschließend sowohl den aktuellen Status als auch den prozentualen Anteil der Verfügbarkeit in dem angegebenen Monatszeitraum.
post12_screen1Da die Darstellung unter Verwendung eines Kuchendiagramms erfolgen soll, ist dieses über die Palette in den Detailbereich des Reports einzufügen.
Die Datenübergabe an das Diagramm erfolgt wie in den vorhergehenden Beispielen mittels Kontextmenü. Wichtig ist, dass das Kuchendiagramm mit zwei Serien bestückt wird.
Serie Availability:
Key expression: “Availability”
Value expression:

$F{sla_availability_percent}

Serie Outage:
Key expression: “Outage”
Value expression:

$F{sla_outage_percent}

post12_screen2Wenn das Diagramm korrekt im Detailbereich platziert worden ist, wird die entsprechende Verfügbarkeit nun pro definiertem Service dargestellt. Um bei der Anzeige mit Ausfallkandidaten zu beginnen, genügt es dem Statement noch ein “order by e.sla_outage_percent” anzuhängen.
Hier kann der erstellte Beispielbericht wie gewohnt geladen werden. Die Vorlage gibt es bei netways.org und auf unserem Demo-System.
Der nächste Teil der Serie ergänzt das Thema Verfügbarkeit noch mit der Integration des Business Process Addons for Nagios.

Bernd Erk
Bernd Erk
CEO

Bernd ist Geschäftsführer der NETWAYS Gruppe und verantwortet die Strategie und das Tagesgeschäft. Bei NETWAYS kümmert er sich eigentlich um alles, was andere nicht machen wollen oder können (meistens eher wollen). Darüber hinaus startet er das wöchentliche Lexware-Backup und investiert seine ganze Energie in den Rest der Truppe und versucht für kollektives Glück zu sorgen. In seiner Freizeit macht er mit sinnlosen Ideen seine Frau verrückt und verbündet sich dafür mit seinem Sohn.

Zeit wird's: netMySLA – SLA für Nagios

Im Zuge von facelift und der Erweiterung des Funktionsumfangs von NETWAYSPortal haben wir ein SLA-Reporting Feature auf Basis von MySQL und der NDO implementiert. Daraus ist nun ein neues Projekt netMySLA entstanden.
Es besteht aus einer Ansammlung von MySQL Prozeduren welche einfach nur in die bestehende NDO importiert werden müssen. Für die SLA-Funktionalität werden hauptsächlich zwei dieser Prozeduren benötigt: np_checkAvailability und np_aggregateSLA.
Erstere ist für die Errechnung des SLA Wertes verantwortlich. Durch die Parametrisierung können Initialstatus, Acknowledgements, Downtimes, etc. mit eingerechnet werden. Es ist außerdem möglich, den  Status ‘Warning’ als Ausfall in die Berechnung einzubeziehen. Neugierige werden den Debug Parameter willkommen heißen, über welchen die Berechnung der Ausgabewerte ‘ein wenig genauer’ ausgegeben wird.

Die zweite Prozedur iteriert durch alle Host- und Servicekombinationen und erstellt für bestimmte Zeitscheiben (Tag, Woche, Monat, Jahr) den SLA Wert welcher anschließend in eine Ergebnistabelle eingetragen wird. Durch tägliche Ausführung der Prozedur erhält man SLA Historienwerte die zukünftig einfach per SQL abgefragt werden können.
Diese Prozeduren sind der erste Versuch eine verfügbarkeitsbezogene Auswertung aus der NDO zu erhalten. Das Projekt wird wie immer als OpenSource unter der GPL Lizenz veröffentlich und kann unter http://www.nagiosforge.org/gf/project/netmysla/ runtergeladen werden.


Marius Hein
Marius Hein
Head of Development

Marius Hein ist schon seit 2003 bei NETWAYS. Er hat hier seine Ausbildung zum Fachinformatiker absolviert, dann als Application Developer gearbeitet und ist nun Leiter der Softwareentwicklung. Ausserdem ist er Mitglied im Icinga Team und verantwortet dort das Icinga Web.

NETWAYS Portal für Nagios V3

In den letzten Wochen haben wir sehr viel Zeit in die nächste Version unseres, auf Typo3 basierenden, Portals investiert. Neben dem Grapher V2 an dem wir seit der Konferenz arbeiten, haben wir viel Zeit in das Interface, neue Suchfunktionen und Übersichten sowie ein NDO basiertes SLA-Reporting investiert.

Obwohl nun die Zeit der Geschenke gekommen ist, werden wir es dieses Jahr nicht mehr schaffen. Marius und Christian werden aber bis Mitte Januar richtig Gas geben um die neue Version zu veröffentlichen.
Wie heisst es so schön… “Freuet euch, s’Christkind kommt bald!”

Bernd Erk
Bernd Erk
CEO

Bernd ist Geschäftsführer der NETWAYS Gruppe und verantwortet die Strategie und das Tagesgeschäft. Bei NETWAYS kümmert er sich eigentlich um alles, was andere nicht machen wollen oder können (meistens eher wollen). Darüber hinaus startet er das wöchentliche Lexware-Backup und investiert seine ganze Energie in den Rest der Truppe und versucht für kollektives Glück zu sorgen. In seiner Freizeit macht er mit sinnlosen Ideen seine Frau verrückt und verbündet sich dafür mit seinem Sohn.