Prometheus: Configuración de las reglas de alerta de Prometheus
Esta documentación forma parte de la guía Alertas. Consulte la guía completa aquí: Cómo funcionan las alertas de Prometheus y cómo configurarlas.
👋 ¡Bienvenido a la documentación de Stackhero!
Stackhero ofrece una solución nube de Prometheus lista para usar que proporciona una serie de beneficios, incluyendo:
Alert Managerincluido para enviar alertas aSlack,Mattermost,PagerDuty, etc.- Servidor de correo electrónico dedicado para enviar alertas de correo electrónico ilimitadas.
Blackboxpara sondearHTTP,ICMP,TCP, y más.- Configuración fácil con un editor de archivos de configuración en línea.
- Actualizaciones sin esfuerzo con solo un clic.
- Rendimiento óptimo y seguridad robusta gracias a una VM privada y dedicada.
Ahorre tiempo y simplifique su vida: solo toma 5 minutos probar la solución de alojamiento en la nube de Prometheus de Stackhero!
Puede ajustar las reglas de alerta de Prometheus editando el archivo rules-alert.yml. Para hacerlo, acceda a su panel de Stackhero, seleccione su servicio de Prometheus y haga clic en "Configuración de reglas de alerta de Prometheus".
Ya hemos añadido algunas reglas de alerta predeterminadas a su instancia de Stackhero para Prometheus, por lo que generalmente no necesitará modificar el archivo rules-alert.yml a menos que se requiera personalización.
A continuación se muestra un ejemplo de una alerta que se activa si el uso del disco supera el 90%:
- alert: "HostOutOfDiskSpace"
expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
for: 2m
labels:
severity: "warning"
annotations:
summary: "Host out of disk space (instance {{ $labels.instance }})"
description: "Disk is almost full (< 10% left)"
value: "{{ $value }}"
Aquí hay otro ejemplo que predice una posible saturación del espacio en disco dentro de las próximas 24 horas:
- alert: "HostDiskWillFillIn24Hours"
expr: (node_filesystem_avail_bytes * 100) / node_filesystem_size_bytes < 10 and ON (instance, device, mountpoint) predict_linear(node_filesystem_avail_bytes{fstype!~"tmpfs"}[1h], 24 * 3600) < 0 and ON (instance, device, mountpoint) node_filesystem_readonly == 0
for: 2m
labels:
severity: "warning"
annotations:
summary: "Host disk will fill in 24 hours (instance {{ $labels.instance }})"
description: "Filesystem is predicted to run out of space within the next 24 hours at the current write rate"
value: "{{ $value }}"
Puede encontrar muchos ejemplos adicionales de reglas de alerta en el sitio web Awesome Prometheus Alerts.