Prometheus: Configurazione delle regole di avviso di Prometheus

Questa documentazione fa parte della guida Avvisi. Consulta la guida completa qui: Come funzionano gli avvisi di Prometheus e come configurarli.

👋 Benvenuti nella documentazione di Stackhero!

Stackhero offre una soluzione Prometheus cloud pronta all'uso che fornisce numerosi vantaggi, tra cui:

  • Alert Manager incluso per inviare avvisi a Slack, Mattermost, PagerDuty, ecc.
  • Server email dedicato per inviare avvisi email illimitati.
  • Blackbox per sondare HTTP, ICMP, TCP e altro ancora.
  • Configurazione facile con editor di file di configurazione online.
  • Aggiornamenti senza sforzo con un solo clic.
  • Prestazioni ottimali e sicurezza robusta grazie a una VM privata e dedicata.

Risparmia tempo e semplifica la tua vita: bastano solo 5 minuti per provare la soluzione di Prometheus cloud hosting di Stackhero!

Puoi regolare le regole di avviso di Prometheus modificando il file rules-alert.yml. Per farlo, accedi alla tua dashboard Stackhero, seleziona il tuo servizio Prometheus e clicca su "Configurazione delle regole di avviso di Prometheus".

Abbiamo già aggiunto alcune regole di avviso predefinite alla tua istanza Stackhero per Prometheus, quindi di solito non sarà necessario modificare il file rules-alert.yml a meno che non sia richiesta una personalizzazione.

Di seguito è riportato un esempio di avviso che si attiva se l'uso del disco supera il 90%:

- alert: "HostOutOfDiskSpace"
  expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
  for: 2m
  labels:
    severity: "warning"
  annotations:
    summary: "Host out of disk space (instance {{ $labels.instance }})"
    description: "Disk is almost full (< 10% left)"
    value: "{{ $value }}"

Ecco un altro esempio che prevede una potenziale saturazione dello spazio su disco entro le prossime 24 ore:

- alert: "HostDiskWillFillIn24Hours"
  expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) predict_linear(node_filesystem_avail_bytes{fstype!~"tmpfs"}[1h], 24 * 3600) < 0 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
  for: 2m
  labels:
    severity: "warning"
  annotations:
    summary: "Host disk will fill in 24 hours (instance {{ $labels.instance }})"
    description: "Filesystem is predicted to run out of space within the next 24 hours at the current write rate"
    value: "{{ $value }}"

Puoi trovare molti altri esempi di regole di avviso sul sito Awesome Prometheus Alerts.