Prometheus: Prometheus įspėjimų taisyklių konfigūravimas

Ši dokumentacija yra Įspėjimai vadovo dalis. Visą vadovą rasite čia: Kaip veikia Prometheus įspėjimai ir kaip juos konfigūruoti.

👋 Sveiki atvykę į Stackhero dokumentaciją!

Stackhero siūlo paruoštą naudoti Prometheus cloud sprendimą, kuris suteikia daugybę privalumų, įskaitant:

  • Įtrauktas Alert Manager, skirtas siųsti įspėjimus į Slack, Mattermost, PagerDuty ir kt.
  • Skirtas el. pašto serveris, skirtas siųsti neribotus el. pašto įspėjimus.
  • Blackbox skirtas HTTP, ICMP, TCP ir kitų protokolų tikrinimui.
  • Lengvas konfigūravimas su internetiniu konfigūracijos failų redaktoriumi.
  • Paprasti atnaujinimai vienu paspaudimu.
  • Optimali veikla ir tvirta sauga, užtikrinama privačios ir dedikuotos VM.

Taupykite laiką ir supaprastinkite savo gyvenimą: tereikia 5 minučių, kad išbandytumėte Stackhero Prometheus cloud hosting sprendimą!

Galite koreguoti Prometheus įspėjimų taisykles redaguodami rules-alert.yml failą. Norėdami tai padaryti, pasiekite savo Stackhero prietaisų skydelį, pasirinkite savo Prometheus paslaugą ir spustelėkite "Prometheus įspėjimų taisyklių konfigūracija".

Jau pridėjome keletą numatytųjų įspėjimų taisyklių jūsų Stackhero for Prometheus instancijai, todėl paprastai nereikės keisti rules-alert.yml failo, nebent reikalinga pritaikymas.

Žemiau pateikiamas įspėjimo pavyzdys, kuris sukeliamas, jei disko naudojimas viršija 90%:

- alert: "HostOutOfDiskSpace"
  expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
  for: 2m
  labels:
    severity: "warning"
  annotations:
    summary: "Host out of disk space (instance {{ $labels.instance }})"
    description: "Disk is almost full (< 10% left)"
    value: "{{ $value }}"

Čia yra kitas pavyzdys, kuris prognozuoja galimą disko vietos užsipildymą per artimiausias 24 valandas:

- alert: "HostDiskWillFillIn24Hours"
  expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) predict_linear(node_filesystem_avail_bytes{fstype!~"tmpfs"}[1h], 24 * 3600) < 0 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
  for: 2m
  labels:
    severity: "warning"
  annotations:
    summary: "Host disk will fill in 24 hours (instance {{ $labels.instance }})"
    description: "Filesystem is predicted to run out of space within the next 24 hours at the current write rate"
    value: "{{ $value }}"

Daugiau papildomų įspėjimų taisyklių pavyzdžių galite rasti Awesome Prometheus Alerts svetainėje.