Monitoring?

Monitoring?

  • Nagios

    Votes: 11 52.4%
  • Zabbix

    Votes: 2 9.5%
  • Zenoss

    Votes: 0 0.0%
  • andere

    Votes: 8 38.1%

  • Total voters
    21

michael-08

Blog Benutzer
Hallo, ich hab auf einem vServer mal zabbix aufgesetzt um mir das mal anzuschauen!

Optisch ist zabbix echt klasse (zabbix 1.6 mit Alternativem Skin)! Unendlich viele Möglichkeiten! Man kommt sich vor wie in einem Rechenzentrum! Wenn man 3 Hosts added hat man eine "Trigger" Übersicht, die bei irgendwelchen Ausfällen blinken und bei normalem Status grün bleiben! Man kann sofort reagieren mit definierten Commands! Ganz reingelesen habe ich mich in zabbix noch nicht, aber ich vermute, damit kann man einen "automatisierten" Überwachunsdienst aufbauen! Falls apache nicht mehr läuft einen apache/restart senden, falls das nicht funktioniert einen /sbin/reboot senden und per mail, sms, jabber sich informieren lassen!

Nagios gefiel mir optisch überhaupt nicht und habe deswegen erstmal zabbix ausprobiert!

Welche Vor und Nachteile kennt ihr!?
 
Last edited by a moderator:

Armadillo

Registered User
Ich finde Nagios ehrlich gesagt auch nicht den Brüller. Allerdings kann man das optisch schon noch aufwerten mit anderen Interfaces. Ich benutze seit neuestem Xymon, das sieht zwar nicht umwerfend aus, aber man hat ne super Übersicht auch bei sehr vielen überwachten Systemen, was alles nicht funktioniert, kann das in Gruppen und Pages unterteilen, echt schicke Sache.

Dienste neu zu starten ist meiner Meinung nach keine Aufgabe eines Monitoringsystems. Es gibt unzählige Gründe warum z.B. ein Apache oder Datenbankserver gerade nicht vom Monitoring erreichbar ist. Deshalb muss hinter einem Monitoring immer ein Administrator sitzen der weiß wie man Probleme entsprechend behebt. Automatische Neustarts, bei denen evt. sogar der Datenbankserver gekillt wird sind aus meiner Sicht eher gefährlich, weil es zu massiven Datenverlusten kommen kann.
Zu /sbin/reboot muss man glaub garnix sagen. Wer seinen Server automatisch neustarten lässt, weil ein Dienst hängt oder der Server nicht erreichbar ist vom Monitoring aus gehört erschossen. :)
 
Last edited by a moderator:

Pijay

Registered User
Hallo,

wir haben unsere eigene Lösung entwickelt und bieten dort unseren Kunden auch die Möglichkeit automatisiert den betreffenden Service und/oder Server neustarten zu lassen. Unter gewissen Umständen macht das durchaus Sinn. Ich meine beispielsweise OVH bietet einen ähnlichen Service an.

Viele Grüße,
Michael
 

CentY

Registered User
Also mir wäre sowas auch zu gefährlich. Muss ja nur mal der Check Prozess hängen oder falsche Daten bekommen. Und schon startet das Ding meinen Server neu obwohl nichts falsch lief. Da log ich mich doch lieber schnell ein und vergewissere mich dass es ein Problem gibt oder auch nicht.

Ich nutze btw. Nagios. ;)
 

Whistler

Blog Benutzer
Oft liegt das Problem ja gar nicht im Prozeß selber sondern tiefer (z.B. DNS weg, Netz weg, Platte voll).
Meise möchte ich schon selbst entscheiden, ob es seine Richtigkeit hat, daß ein Prozeß weg ist.
Lediglich für Abstürze bekannte Applikationen (z.B. ein bestimmter proprietärer Lizenzmanager) werden automatisch neu gestartet.

Für das Monitoring bevorzuge ich Nagios wegen seiner Schlichtheit (z.B. ist keine Datenbank nötig). Als Monitoring-Host reicht ein kleiner, robuster Server ohne weitere Aufgaben und das Webinterface kann man zur Not auch noch per Lynx bedienen.
 

michael-08

Blog Benutzer
Wohl ein Vorteil dass Nagios keine Datenbank braucht! Wo speichert Nagios aber die ganzen Daten und wie errechnet Nagios? Oder ist das lediglich eine Art "Live Monitoring"? Bei Zabbix ist es so, dass die Daten so lange vorgehalten werden wie man definiert! Voreinstellung sind glaube ich 90 Tage!

Wer seinen Server automatisch neustarten lässt, weil ein Dienst hängt oder der Server nicht erreichbar ist vom Monitoring aus gehört erschossen.
Lediglich für Abstürze bekannte Applikationen (z.B. ein bestimmter proprietärer Lizenzmanager) werden automatisch neu gestartet.
Das ist bei Zabbix auch so möglich! Man kann frei wählen ob Zabbix einen Dienst neustartet oder lediglich informiert! Wobei ein Restart eines einzelnen Prozesses doch nicht so extrem ist oder?

Neben dem Dashboard von Zabbix gibt es auch noch die "Overview" Ansicht, die ist ähnlich wie beispielsweise eine Overview von Flugüberwachungsstellen! Da blinkt alles und man kann direkt dann per Klick die Trigger oder Informationen aufrufen!

Im alternativen "Black-Blue" Skin sieht das dann auch nochmal besser aus als im hier dargestellten "Standard" Skin

Einstellen lässt sich auch die refresh Rate! Bei einem refresh von allen 15 bis 30 Sekunden allerdings ist der Traffic dann dementsprechend höher als bei einer refresh Rate von 60 Sekunden oder 180 Sekunden!

768px-Zabbix_overview.png

Man hört Zabbix viel zu selten. Alle hier sprechen von und schwören auf Nagios!

Hier welche von 1.6.6 Alternativ Skin:

db.JPGzabbix Kopie.jpgchart2.PNG
 
Last edited by a moderator:

Armadillo

Registered User
Wie du eigentlich selber sehen solltest, allein an deiner Umfrage, benutzen eben nicht alle Nagios. Und wenn die anderen Hersteller keine Werbung machen ist es logisch, dass die nicht verbreiteter sind. Oftmals liegt es auch daran, dass sie einfach nicht so performant sind und deshalb seltener benutzt werden.
Nagios bekommt bei einer bestimmten Anzahl Hosts mit entsprechend viel Diensten z.B. auch Probleme mit seinen Tests. Dann ist es kein Live-Monitoring mehr, sondern Nagios hinkt mit seinen Checks hinterher und es dauert ne ganze Weile bis es dann wieder rund läuft. Ist z.B. nen großes Problem wenns nen größeren Ausfall gibt. Unter anderem ein Grund warum ich Xymon einsetze. ;)
Beide sind sich übrigens in der Hinsicht ähnlich, dass sie Daten nicht ewig vorhalten sondern nur die entsprechenden Grafiken berechnen und die Daten dann nach relativ kurzer Zeit wieder wegschmeißen. Macht auch Sinn, wenn ich seh was für Daten Nagios alles sammelt.
Ich habe für nicht allzu langer Zeit nen Testnagios aufgesetzt um 30 Drucker zu monitoren. Das ganze wurde mit dem Datenbankplugin (glaub ndo war es) in ner MySQL-Datenbank gesichert. Ich hab dabei innerhalb von 4 Tagen eine Datenbankgröße von 20MB überschritten. Wenn ich mir das jetzt mit 500 Hosts und jeweils 20 Checks und nicht nur 2 wie bei den Druckern vorstelle...

Kann man sicher auch optimieren, klar. Aber der Sinn eines Monitoringsystems ist ja eigentlich sofort zu melden wenn etwas nicht stimmt und das Problem entsprechend zu beheben. Dann kann man sich z.B. Emails zuschicken lassen, wenn entsprechende Extremwerte aufgetreten sind. Dadurch kann man auch noch nach Monaten schauen, was wann genau ein Problem hatte. Langzeitgraphen werden sowohl bei Nagios (durch Plugins) als auch Xymon (standardmäßig für ALLE Dienste) trotzdem angefertigt und entsprechend weitergeführt, auch über viele Monate.
 
Top