OpenNMS meets HP InsightManager

December 10, 2009 1 min read OpenNMS HP How-To Ronny Trommer

Nach einer relativ langen Nacht und etlichen Stunden asterisk-iaxmodem-hylafax debugging habe ich die gunst der Stunde genutzt und die vorbildlich konfigurierten HP InsightManager genauer angesehen. Die folgenden SNMP-OIDs haben sich aus meiner Sicht für die Überwachung als sinnvoll ergeben:

CPQIDA-MIB

Name	OID
cpqDaSpareStatus	.1.3.6.1.4.1.232.3.2.4.1.1.3
cpqDaLogDrvStatus	.1.3.6.1.4.1.232.3.2.3.1.1.4
cpqDaPhyDrvStatus	.1.3.6.1.4.1.232.3.2.5.1.1.6

CPQHLTH-MIB

Name	OID
cpqHeThermalTempStatus	.1.3.6.1.4.1.232.6.2.6.3.0
cpqHeThermalSystemFanStatus	.1.3.6.1.4.1.232.6.2.6.4.0
cpqHeThermalCpuFanStatus	.1.3.6.1.4.1.232.6.2.6.5.0
cpqHeFltTolPowerSupplyStatus	.1.3.6.1.4.1.232.6.2.9.3.1.5
cpqHeResMemModuleCondition	.1.3.6.1.4.1.232.6.2.14.11.1.5

Die MIBS können von der ByteSphere MIB-Online Datenbank heruntergeladen werden. Für die Überwachung habe ich den SNMP-Monitor verwendet wie er in der Version ab 1.6.4 mit der Möglichkeit zum SNMP-Table Monitoring bietet. Die vollständige Konfiguration ist im OpenNMS Wiki HP InsightManager dokumentiert und beschrieben. Für den ein oder anderen sollten damit defekte Lüfter, RAID-Verbände und andere Überraschungen keine Probleme mehr darstellen.

OpenNMS ready?

December 3, 2009 3 min read Monitoring OpenNMS Ronny Trommer

Es gibt Dinge die werden einem bei der Einführung eines NMS häufig nicht gesagt, ganz ohne Arbeit gehts leider nicht. Die alleinige Installation eines Netzwerk-Management-Systems ist, neben der eigentlichen Auswahl - die schon ziemlich nervenaufreibend sein kann, nur die halbe Miete. Mit dem Einsatz eines NMS wollen SNMP-Agenten befragt, SNMP-Traps und Syslog Events empfangen und ausgewertet werden. Um von einem NMS richtig profitieren zu können, kommen also nicht darum herum, sich mit Ihren Geräten und Netzwerk-Komponenten zu beschäftigen. Die folgende, nicht unbedingt vollständige Aufzählung, können als Hilfestellung bei der Einführung von OpenNMS oder einem jeden anderen NMS hilfreich sein.

Just another meaning about Business Process Monitoring

November 28, 2009 4 min read OpenNMS Ronny Trommer

Zuviel Hotel ohne Internet bekommen mir irgendwie nicht wirklich gut. Mit einem einfachen Text-Editor und viel Zeit, habe ich ein paar Gedanken zum Thema Business Process Monitoring (BPM) aufgeschrieben. Häufig wird dies im Zusammenhang mit der Einführung eines Netzwerk-Management-Systems (NMS) oder Monitoring-Tools gesehen.

Wenn man sich im Internet zum Monitoring und Netzwerk-Management umsieht, wird man schnell feststellen, dass klassisches Netzwerk-Management und Monitoring durchgekaut scheinen und als ziemlich out gelten. Stattdessen versuchen verschiedene Anbieter ihre NMS-Anwendungen und Tools, durch ein Feature namens “Business-Process-Monitoring” aufzuwerten.

Ich behaupte, dass jedes Management- oder Monitoring-Tool (wie bspw.: OpenNMS, Nagios, Icinga, Zabbix, Zenoss …), mit der Fähigkeit eigene Skripte oder Programme auszuführen, zum Business Process Monitoring genutzt werden können. Letztendlich liegt es an der Fähigkeit des Monitor-Entwicklers, wie gut er die Abläufe oder Prozesse in einem Unternehmen versteht und im Monitor (Skript/Programm) abbilden kann. Wer nach Business Process Monitoring sucht, wird vermutlich erst einmal einen haufen Marketing-Unterlagen stoßen, die nichts ausser Luftvokabular enthalten. Das ganze ist auch ziemlich logisch, schließlich kann man den Test eines Geschäftsprozesses nicht mit einem einfachen ping-Test vergleichen. Es gibt für die Parametrisierung eben eine ganze Menge “Kommt-ganz-darauf-an´s” zu klären. Die Wahl des Tools sehe ich daher eher zweitrangig. Wie so oft, liegt für mich der Anbieter vorn, abgesehen vom Preis ;), der die Anforderungen am besten versteht und mit seinem Monitoring-Tool effizient umgehen kann.

Wie man sich leicht vorstellen kann, sind Business Process Monitore verhältnismässig teuer. Das liegt daran, dass einerseits Ressourcen wie (Zeit, Personal, Dienstleister), um die Monitore zu entwickeln, andererseits auch Ressourcen wie CPU-Zeit und Lizenzen für die Anwendung oder Datenbank, benötigt werden. Ein Business Process Monitor benötigt häufig für den Test genau die gleichen Ressourcen wie ein realer Anwender. Bevor man sich also vollständig den Buzzwords hingibt, sollte man sich zunächst klar machen, dass Geschäftsanwendungen, auch wenn sie SAP, Microsoft Dynamics NAV etc. heißen, verteilte Netzwerk-Anwendungen sind, die eine Server- und Netzwerk-Infrastruktur benötigen und in den meisten Fällen zentralisiert aufgebaut sind. Sorry an alle Vorstände, Geschäftsführer und BWL´er, ich weiss es würde besser gefallen, wenn man diesen ganzen Kram mit den ganzen Leuten nicht benötigen würde, geht aber leider nicht anders ;)

Monitoring layer model TCP/IP-Schichten und deren Monitore

Die oben gezeigte Abbildung ist Anlehnung an das TCP-Schichtmodell entstanden und soll darstellen wo sich das BPM aus meiner Sicht einordnen lässt. Die Unternehmens-Anwendungen sind also meistens über mehrere Server verteilt und hängen damit massgeblich von den Netzwerk-Schichten ab. Es ist leicht verständlich, je höher in den Schichten überwacht wird, desto komplexer und spezieller müssen auch die Monitore sein. Das gleiche gilt auch für die Fehlerdiagnose. Je weiter oben in den Schichten ein Fehler auftritt, desto mehr muss ein Support-Mitarbeiter wissen um den Fehler zu beheben. Die Fehlerdiagnose erfolgt daher auch eher von unten nach oben. Die Tools ping, traceroute und nmap sind nicht ohne Grund die am Häufigsten verwendeten Tools die ein Administrator oder Support-Mitarbeiter zur Fehlerdiagnose verwendet. Die Monitore in den unteren Schichten sind extrem günstig, da die meisten Netzwerk-Management und -Monitoring-Anwendungen fertige und leistungsfähige Monitore direkt mitbringen.

Ein ganz einfaches Beispielt sollte das hier verdeutlichen. Sie haben einen Monitor geschrieben, der einen konkreten Anwendungsfall ihrer Geschäftsprozesse, bspw. den Abruf eines Lieferscheins oder eine Buchung, testet. Auf dem Datenbankserver ist eine redundant ausgelegte Festplatte defekt oder ein redundanter Lüfter ist ausgefallen. Sie werden keine Beeinträchtigung im Geschäftsprozess durch den Monitor feststellen, er funktioniert wie gewohnt. Mit etwas Glück kann man sehen, dass die Ausführung vielleicht etwas länger dauert, der Rückschluss auf einen RAID-Verband im Status “degraded” ist aber auch dem besten Netzwerk-Administrator wohl etwas zuviel abverlangt. Der Ausfall einer weiteren Platte oder das Herunterfahren des Systems zum Schutz vor Überhitzung, wird den Geschäftsprozess dann wirklich erst beeinträchtigen, ab dann wird es meistens teuer. Was hilft es also, wenn der komplizierteste Business-Prozesse in der letzten Abhängigkeit überwacht und getestet wird, dann im Fehlerfall aber überhaupt keine sinnvolle Hilfestellung zur Entstörung oder Eingrenzung des Problems vorliegt. Sie haben also eine Möglichkeit durch Austausch der Festplatte oder des Lüfters zur Prävention verpasst. Die Überwachung des Business-Prozesses stellt also in meinen Augen eher am Ende der Monitoring-Kette eine Art, Qualitätssicherung dar. Fällt ein Monitor, der einen Geschäftsprozess überwacht aus, dann haben auch letztendlich alle Redundanzen versagt und das Kind liegt schon im Brunnen. Meine Erfahrungen aus der Systembetreuung hat mir gezeigt, dass Fehler häufig in den unteren Schichten auftreten. Bei der Einführung von BPM sollten man sich daher aus meiner Sicht, die Frage stellen ob ein Netzwerk-Management und Monitoring existiert und auch wie gewünscht funktioniert, da diese Überwachung sich implizit auch auf die Überwachung ihrer Geschäftsanwendung auswirkt.

gl & hf

Die Agenten Situation

November 27, 2009 5 min read Monitoring Categories Ronny Trommer

Auf der diesjährigen Netways OSMC wurde ein guter Vortrag von Dr. Michael Schwartzkopff über Net-SNMP gehalten. Bei den anschliessenden Fragen stellte ich dann jedoch ziemlich schnell fest, dass einige Teilnehmer check_by_ssh oder eigene Plugins mit NRPE, NSClient gegenüber SNMP vorziehen. Da ich dem SNMP Protokoll eher freundlich gesinnt bin, kam es nach dem Vortrag zu wirklich konstruktiven Off-Topic Gesprächen. Eines der am häufigst genannten schwächen, neben schlechten SNMP-Agenten, ist die Verwendung von UDP. Die Verwendung von UDP als verbindungsloses und unbestätigtes Transportprotokoll wird als nicht ausreichend angesehen. Weiterhin wird “Simple” in der Bezeichnung des Protokolls nicht wirklich als “Simple” empfunden. Da hauptsächlich Kollegen mit reichlich Erfahrung aus dem Nagios und Icinga Umfeld anwesend waren, wurden Plugins für NRPE, NSClient und check_by_ssh als bessere Alternative beschrieben.

Newer posts