Prometheus: Configuración de las reglas de alerta de Prometheus

Esta documentación forma parte de la guía Alertas. Consulte la guía completa aquí: Cómo funcionan las alertas de Prometheus y cómo configurarlas.

👋 ¡Bienvenido a la documentación de Stackhero!

Stackhero ofrece una solución nube de Prometheus lista para usar que proporciona una serie de beneficios, incluyendo:

  • Alert Manager incluido para enviar alertas a Slack, Mattermost, PagerDuty, etc.
  • Servidor de correo electrónico dedicado para enviar alertas de correo electrónico ilimitadas.
  • Blackbox para sondear HTTP, ICMP, TCP, y más.
  • Configuración fácil con un editor de archivos de configuración en línea.
  • Actualizaciones sin esfuerzo con solo un clic.
  • Rendimiento óptimo y seguridad robusta gracias a una VM privada y dedicada.

Ahorre tiempo y simplifique su vida: solo toma 5 minutos probar la solución de alojamiento en la nube de Prometheus de Stackhero!

Puede ajustar las reglas de alerta de Prometheus editando el archivo rules-alert.yml. Para hacerlo, acceda a su panel de Stackhero, seleccione su servicio de Prometheus y haga clic en "Configuración de reglas de alerta de Prometheus".

Ya hemos añadido algunas reglas de alerta predeterminadas a su instancia de Stackhero para Prometheus, por lo que generalmente no necesitará modificar el archivo rules-alert.yml a menos que se requiera personalización.

A continuación se muestra un ejemplo de una alerta que se activa si el uso del disco supera el 90%:

- alert: "HostOutOfDiskSpace"
  expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
  for: 2m
  labels:
    severity: "warning"
  annotations:
    summary: "Host out of disk space (instance {{ $labels.instance }})"
    description: "Disk is almost full (< 10% left)"
    value: "{{ $value }}"

Aquí hay otro ejemplo que predice una posible saturación del espacio en disco dentro de las próximas 24 horas:

- alert: "HostDiskWillFillIn24Hours"
  expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) predict_linear(node_filesystem_avail_bytes{fstype!~"tmpfs"}[1h], 24 * 3600) < 0 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
  for: 2m
  labels:
    severity: "warning"
  annotations:
    summary: "Host disk will fill in 24 hours (instance {{ $labels.instance }})"
    description: "Filesystem is predicted to run out of space within the next 24 hours at the current write rate"
    value: "{{ $value }}"

Puede encontrar muchos ejemplos adicionales de reglas de alerta en el sitio web Awesome Prometheus Alerts.