Prometheus: Configuração das regras de alerta do Prometheus

Esta documentação faz parte do guia Alertas. Consulte o guia completo aqui: Como funcionam os alertas do Prometheus e como configurá-los.

👋 Bem-vindo à documentação da Stackhero!

A Stackhero oferece uma solução Prometheus cloud pronta a usar que proporciona uma série de benefícios, incluindo:

  • Alert Manager incluído para enviar alertas para Slack, Mattermost, PagerDuty, etc.
  • Servidor de email dedicado para enviar alertas de email ilimitados.
  • Blackbox para sondar HTTP, ICMP, TCP, e mais.
  • Configuração fácil com editor de ficheiros de configuração online.
  • Atualizações sem esforço com apenas um clique.
  • Desempenho ótimo e segurança robusta alimentados por uma VM privada e dedicada.

Poupe tempo e simplifique a sua vida: leva apenas 5 minutos para experimentar a solução de hospedagem cloud Prometheus da Stackhero!

Pode ajustar as regras de alerta do Prometheus editando o ficheiro rules-alert.yml. Para fazer isso, aceda ao seu painel Stackhero, selecione o seu serviço Prometheus e clique em "Configuração das regras de alerta do Prometheus".

Já adicionámos algumas regras de alerta padrão à sua instância Stackhero para Prometheus, por isso geralmente não precisará de modificar o ficheiro rules-alert.yml a menos que seja necessária personalização.

Abaixo está um exemplo de um alerta que é acionado se a utilização do disco exceder 90%:

- alert: "HostOutOfDiskSpace"
  expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
  for: 2m
  labels:
    severity: "warning"
  annotations:
    summary: "Host out of disk space (instance {{ $labels.instance }})"
    description: "Disk is almost full (< 10% left)"
    value: "{{ $value }}"

Aqui está outro exemplo que prevê uma potencial saturação do espaço em disco nas próximas 24 horas:

- alert: "HostDiskWillFillIn24Hours"
  expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) predict_linear(node_filesystem_avail_bytes{fstype!~"tmpfs"}[1h], 24 * 3600) < 0 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
  for: 2m
  labels:
    severity: "warning"
  annotations:
    summary: "Host disk will fill in 24 hours (instance {{ $labels.instance }})"
    description: "Filesystem is predicted to run out of space within the next 24 hours at the current write rate"
    value: "{{ $value }}"

Pode encontrar muitos exemplos adicionais de regras de alerta no site Awesome Prometheus Alerts.