IT-Monitoring Teil 2: Planung führt zum Erfolg
Grundlage für ein gutes Monitoring sind einfach gesagt Messwerte – viele Messwerte. Für ein erfolgreiches Troubleshooting hilft es, oft unterschiedlichste Messwerte abzugleichen, um Fehler einzugrenzen. Darum ist eine gute Basis die alte Jäger- und Sammlerweisheit, alles mitzunehmen, was wir finden. Filtern und aussortieren können wir später immer noch.
Da wir aber nicht in der Masse ertrinken wollen, müssen die einzelnen Checks gewichtet werden. Was ist so wichtig, dass es einen Alarm auslöst?
Hier wird man sich langsam an das Optimum herantasten, in der Anfangsphase wird es viele Fehlalarme hageln. Diese Phase kann nerven und muss trotzdem gewissenhaft erledigt werden. Dimmen wir jetzt zu viele Alarme weg, um wieder Ruhe zu haben, entgehen uns später wichtige Fehler.
Aber jetzt ist auch ein guter Zeitpunkt darüber nachzudenken, ob die Maschinen mit 95–98% Plattenfüllstand nicht vielleicht doch etwas mehr Platz bekommen sollten. Erst wenn wir hier wieder in ruhigen Gewässern sind, machen wir weiter.
Wie sieht die Planung für ein gutes Monitoring aus?
Über die Services zum Glück
Dann gehen wir einen Schritt weiter und bilden Services ab: Zum Service Mail gehören Exchange-Server, Mailgateways, Firewalls, Switches, Storage, ActiveDirectory etc. Der Service Mail funktioniert erst, wenn alle diese Teile arbeiten. Wenn wir für einen Service alle Abhängigkeiten zusammengetragen haben, gibt es einen Service „Mail“. Und wenn dieser kritisch wird, weil eine wichtige Komponente ausfällt, wollen wir das wissen. Und zwar am liebsten per Mail, SMS, App und Web. Laut, rot und sofort!
Und das wiederholen wir für ERP, XenApp/XenDesktop etc. Es ist erstaunlich, wie viele schöne Pläne wir zeichnen können, die solche Services abbilden. Und wieder werden sich mit der Zeit Teile zeigen, die es noch nicht in die Pläne geschafft haben. Beobachten und pflegen ist Devise, bei jedem Fehler, den wir nicht vorher erkannt haben, können wir uns fragen, wie hätte ich ihn im Monitoring abbilden können?
Jetzt sehen wir im Webportal schnell, wenn etwas Wichtiges ausfällt und wir werden bei wirklich wichtigen Sachen alarmiert und haben trotzdem so viele Performancewerte, wie wir bekommen können. Dies ist ein guter Zeitpunkt, sich das erste Mal auf die Schulter zu klopfen. Ein großes Stück ist geschafft und wir blicken stolz auf ein funktionierendes Monitoring, das seinen Namen auch verdient.
Der erste Erfolg
Und der berühmte C‑Level?
Zeit für den IT-Leiter und seine Kollegen. Ein gutes Monitoring bleibt nicht lange verborgen und jetzt kommen Leute, die sich zwar nicht für store.exe interessieren, aber wissen wollen, wie es um das Gesamtsystem steht. Oder zumindest eine Abteilung. Oder einen Service. Hier sind die Ansprüche wieder anders, aber wir haben ja jetzt eine gute Grundlage.
Nun werden Services visualisiert, indem sie in Visio-Plänen oder Bildern dargestellt werden. Das können Bilder ganzer Racks sein oder das Mailsystem mit allen seinen Mailflüssen und Abhängigkeiten. In diese Bilder werden dann die Meldungen der wichtigsten Checks montiert und so sieht man auf einen Blick, ob es läuft oder wo der Fehler liegt.
Mit etwas Glück schaut jetzt der IT-Leiter erst mal auf unseren schönen Mailflow, wenn er zwischen Tür und Angel hört, dass „wieder keine Mails funktionieren“. Ist dort alles grün, bleibt er entspannt, denn die wichtigen Backendsysteme laufen ja.
Und wenn die Kollegen aus dem Support erst bemerkt haben, wie schön so ein Management-View als Einstieg ins Troubleshooting ist…