2016-12-25 6 views
0

Ich benutze Zabbix 3.2; Ich habe die Mail-Alert-Aktion für alle Trigger konfiguriert. Meine Frage ist, Sag Trigger (A) Warnungen (Problem-Ereignis) bei Eskalation und kehrt nach wenigen Minuten zu normal (OK Ereignisalarm). Ich muss den Alarm stoppen, wenn der gleiche 'A' Trigger in den nächsten Minuten auftritt. Wie kann es möglich sein? Ich habe mit dieser Dokumentation versucht; gleichen Trigger Alarm Stop in Zabbix

+0

Könnten Sie bitte ein wenig verdeutlichen - möchten Sie nur einmal warnen, wenn das Problem häufig wiederholt - "Klappen"? – Richlv

+0

für ex, Ein Trigger - {host.cpu.util [, laden]. Last()}> 80; Ich erhalte eine "Problem" -Warnung, wenn die CPU> 80 lädt, und "OK", wenn die Funktion aktiviert wird <80; Wenn derselbe Trigger (d. H. Wieder CPU-Last> 80) in den nächsten 15 Minuten auftritt; Ich möchte keine Warnung erhalten. Ist es möglich? thks for ur Berücksichtigung @ R – mkdr27

+0

Eine Antwort basierend auf meinem Verständnis des Problems hinzugefügt. – Richlv

Antwort

1

Die Frage scheint zu verhindern, Trigger-Flattern. In der Regel werden drei Methoden vorgeschlagen:

  • Verwendung trigger functions - zum Beispiel, statt last() Verwendung avg(15m) - dann die Alarmierungs erst nach dem Durchschnittswert passieren werden für 15 Minuten hat die Schwelle überschritten. Andere nützliche Triggerfunktionen könnten min() und max()
  • Verwendung Hysterese sein - dies macht Trigger Feuer auf eine Schwelle, aber auf eine andere lösen. Vor Zabbix 3.2 wurde das getan in the trigger expression; da Zabbix 3.2 gibt es eine separate "recovery" field
  • Verwendung action escalations, die zunächst nichts zu tun, und nur einen Alarm senden, wenn das Problem für einige Zeit dort gewesen ist - zum Beispiel der Warnung auf dem zweiten oder dritten Schritt aussendet

Alle drei Methoden erreichen ein ähnliches Ergebnis, aber die wichtigsten Unterschiede sind:

  • die erste Methode - Triggerfunktionen - macht später der Auslöser Feuer, sondern reduziert die Anzahl der Ereignisse (die Zeiten Brände auslösen)
  • der zweite Methode - Hysterese - lässt den Auslöser gleichzeitig mit dem Auslöser "flappy" auslösen, verzögert jedoch das Wiederherstellungsereignis. Es reduziert auch die Anzahl der Ereignisse (die Zeiten auslösen Feuer)
  • die dritte Methode - verzögerte Eskalationsschritte - hat keinen Einfluss auf den Auslöser überhaupt, kann es weiter flattern. Es wird jedoch nur benachrichtigt, wenn das Problem länger besteht.

Hysterese wird normalerweise alarmieren, wenn ein Auslöser flatterte; verzögerte Eskalationsschritte ignorieren kurzlebige Probleme.

Kompliziert gesagt, würde ich normalerweise mit der ersten Methode gehen - es ist am einfachsten zu konfigurieren, am schwersten zu konfigurieren und am leichtesten zu verstehen. Ich würde mit einer der beiden anderen Methoden gehen, wenn ich speziell die Art und Weise, wie sie Ereignisse/Warnungen verhalten, benötigen - diese Methoden haben ein höheres Potenzial, falsch konfiguriert oder missverstanden zu werden.

Beachten Sie, dass die Elementschlüsselreferenz im Kommentar falsch ist - Host wird vom Schlüssel mit Doppelpunkt getrennt, vollständiger Schlüsselname fehlt und der Parameter ist falsch. Siehe the agent key page im Handbuch für die korrekte Schlüsselsyntax.

+0

mit Hysterese für Delapyed Recovery-Ereignis half mir, das Problem @Richlv zu lösen – mkdr27