Ich versuche Prometheus, Grafana und Blackbox_exporter verwenden, um meine Server von Ping (ICMP) zu überwachen. Wir sind kürzlich mit Network Unstable konfrontiert worden, aber meine Einstellung kann keine Warnung anzeigen. Ich frage mich, sollte ich 'Probe_Dauer_Sekunden' oder andere Probe-Methode verwenden?Wie Prometheus, Grafana und Blackbox_exporter für Ping-Verlust-Rate einrichten
grfana Einstellung Metrics: probe_duration_seconds und Panel-Datenquelle ist prometheus
blackbox.yml:
modules:
icmp:
prober: icmp
timeout: 5s
icmp:
protocol: "icmp"
preferred_ip_protocol: "ip4"
prometheus.yml:
global:
scrape_interval: 15s
external_labels:
monitor: 'codelab-monitor'
scrape_configs:
- job_name: 'blackbox'
scrape_interval: 5s
metrics_path: /probe
params:
module: [icmp] #ping
static_configs:
- targets: ['192.168.1.29']
labels:
group: 'env A'
- targets: ['192.168.2.185', '192.168.3.185', '192.168.4.185']
labels:
group: 'env B'
relabel_configs:
- source_labels: [__address__]
regex: (.*)(:80)?
target_label: __param_target
replacement: ${1}
- source_labels: [__param_target]
regex: (.*)
target_label: instance
replacement: ${1}
- source_labels: []
regex: .*
target_label: __address__
replacement: 127.0.0.1:9115
In meinem Fall, ich manuelle Eingabe der "Ping 192.168.2.185", und verlor 25% verloren. Gibt es eine bessere Methode? –
Nach dem Überfliegen des Quellcodes von blackbox_explorer, ich fand es scheint nur zwei Variablen könnte audio, probe_success und probe_duration_seconds –
Ich fand alle Werte von Probe_success sind Nullen, so dass es auch nutzlos ist. :( –