17. Dezember 2019 
Marc Wilhelmi 

IT-Moni­to­ring Teil 2: Planung führt zum Erfolg

Grund­lage für ein gutes Moni­to­ring sind einfach gesagt Mess­werte – viele Mess­werte. Für ein erfolg­rei­ches Trou­ble­shoo­ting hilft es, oft unter­schied­lichste Mess­werte abzu­glei­chen, um Fehler einzu­grenzen. Darum ist eine gute Basis die alte Jäger- und Samm­ler­weis­heit, alles mitzu­nehmen, was wir finden. Filtern und aussor­tieren können wir später immer noch.

Da wir aber nicht in der Masse ertrinken wollen, müssen die einzelnen Checks gewichtet werden. Was ist so wichtig, dass es einen Alarm auslöst?
Hier wird man sich langsam an das Optimum heran­tasten, in der Anfangs­phase wird es viele Fehl­alarme hageln. Diese Phase kann nerven und muss trotzdem gewis­sen­haft erle­digt werden. Dimmen wir jetzt zu viele Alarme weg, um wieder Ruhe zu haben, entgehen uns später wich­tige Fehler.

Aber jetzt ist auch ein guter Zeit­punkt darüber nach­zu­denken, ob die Maschinen mit 95–98% Plat­ten­füll­stand nicht viel­leicht doch etwas mehr Platz bekommen sollten. Erst wenn wir hier wieder in ruhigen Gewäs­sern sind, machen wir weiter.

Wie sieht die Planung für ein gutes Moni­to­ring aus?

Über die Services zum Glück

Dann gehen wir einen Schritt weiter und bilden Services ab: Zum Service Mail gehören Exch­ange-Server, Mail­ga­te­ways, Fire­walls, Swit­ches, Storage, Acti­ve­Di­rec­tory etc. Der Service Mail funk­tio­niert erst, wenn alle diese Teile arbeiten. Wenn wir für einen Service alle Abhän­gig­keiten zusam­men­ge­tragen haben, gibt es einen Service „Mail“. Und wenn dieser kritisch wird, weil eine wich­tige Kompo­nente ausfällt, wollen wir das wissen. Und zwar am liebsten per Mail, SMS, App und Web. Laut, rot und sofort!

Und das wieder­holen wir für ERP, XenApp/XenDesktop etc. Es ist erstaun­lich, wie viele schöne Pläne wir zeichnen können, die solche Services abbilden. Und wieder werden sich mit der Zeit Teile zeigen, die es noch nicht in die Pläne geschafft haben. Beob­achten und pflegen ist Devise, bei jedem Fehler, den wir nicht vorher erkannt haben, können wir uns fragen, wie hätte ich ihn im Moni­to­ring abbilden können?

Jetzt sehen wir im Webportal schnell, wenn etwas Wich­tiges ausfällt und wir werden bei wirk­lich wich­tigen Sachen alar­miert und haben trotzdem so viele Perfor­man­ce­werte, wie wir bekommen können. Dies ist ein guter Zeit­punkt, sich das erste Mal auf die Schulter zu klopfen. Ein großes Stück ist geschafft und wir blicken stolz auf ein funk­tio­nie­rendes Moni­to­ring, das seinen Namen auch verdient.

Der erste Erfolg

Und der berühmte C‑Level?

Zeit für den IT-Leiter und seine Kollegen. Ein gutes Moni­to­ring bleibt nicht lange verborgen und jetzt kommen Leute, die sich zwar nicht für store.exe inter­es­sieren, aber wissen wollen, wie es um das Gesamt­system steht. Oder zumin­dest eine Abtei­lung. Oder einen Service. Hier sind die Ansprüche wieder anders, aber wir haben ja jetzt eine gute Grundlage.

Nun werden Services visua­li­siert, indem sie in Visio-Plänen oder Bildern darge­stellt werden. Das können Bilder ganzer Racks sein oder das Mail­system mit allen seinen Mail­flüssen und Abhän­gig­keiten. In diese Bilder werden dann die Meldungen der wich­tigsten Checks montiert und so sieht man auf einen Blick, ob es läuft oder wo der Fehler liegt.

Mit etwas Glück schaut jetzt der IT-Leiter erst mal auf unseren schönen Mail­flow, wenn er zwischen Tür und Angel hört, dass „wieder keine Mails funk­tio­nieren“. Ist dort alles grün, bleibt er entspannt, denn die wich­tigen Backendsys­teme laufen ja.

Und wenn die Kollegen aus dem Support erst bemerkt haben, wie schön so ein Manage­ment-View als Einstieg ins Trou­ble­shoo­ting ist…

IT-Moni­to­ring kann mehr
Weitere Beiträge aus unserer Artikelserie