Prometheus: Introducción a las alertas de Prometheus
Esta documentación forma parte de la guía Alertas. Consulte la guía completa aquí: Cómo funcionan las alertas de Prometheus y cómo configurarlas.
👋 ¡Bienvenido a la documentación de Stackhero!
Stackhero ofrece una solución nube de Prometheus lista para usar que proporciona una serie de beneficios, incluyendo:
Alert Managerincluido para enviar alertas aSlack,Mattermost,PagerDuty, etc.- Servidor de correo electrónico dedicado para enviar alertas de correo electrónico ilimitadas.
Blackboxpara sondearHTTP,ICMP,TCP, y más.- Configuración fácil con un editor de archivos de configuración en línea.
- Actualizaciones sin esfuerzo con solo un clic.
- Rendimiento óptimo y seguridad robusta gracias a una VM privada y dedicada.
Ahorre tiempo y simplifique su vida: solo toma 5 minutos probar la solución de alojamiento en la nube de Prometheus de Stackhero!
Prometheus puede analizar sus métricas y activar alertas basadas en reglas que usted define. Con Stackhero para Prometheus, las alertas se procesan en dos etapas. Primero, se evalúan las reglas de alerta de Prometheus y luego Alert Manager toma el control.
Todo está preinstalado y configurado con Stackhero para Prometheus, por lo que solo necesita realizar una configuración mínima, como agregar su dirección de correo electrónico, para comenzar a recibir alertas.
Vista general de Stackhero para Prometheus
Introducción a las reglas de alerta de Prometheus
Cuando Prometheus recupera métricas, las evalúa en función de las reglas especificadas en el archivo rules-alert.yml. Estas reglas de alerta definen umbrales y ventanas de tiempo para activar alertas basadas en las métricas recopiladas.
Por ejemplo, se puede activar una alerta si el uso del disco supera el 80%. Además, se pueden configurar reglas para predecir condiciones futuras y enviar una alerta si se estima que el espacio en disco se llenará completamente en las próximas 24 horas.
Otro caso de uso común implica detectar comportamientos inusuales. Por ejemplo, si hay un aumento repentino en el uso del ancho de banda de la red, se puede activar una alerta para ayudar a detectar posibles ataques de denegación de servicio distribuido (DDoS) o intentos de exfiltración de datos.
Las reglas de alerta de Prometheus están incluidas directamente en el servidor Prometheus.
Introducción a Alert Manager
Alert Manager recibe las alertas que las reglas de alerta de Prometheus han activado. Deduplica las alertas, las agrupa y luego las reenvía a través de varios canales de notificación como correo electrónico, Slack, Mattermost, PagerDuty, y más. Su archivo de configuración es alert-manager.yml.
Por ejemplo, si ocurre una ralentización del servidor, las reglas de alerta de Prometheus pueden activar alertas separadas para el aumento de carga y el uso de CPU. Alert Manager recibe estas alertas, las agrupa ya que se relacionan con el mismo servidor, y envía una notificación consolidada al destinatario o equipo adecuado según su configuración.
Si la ralentización continúa, Prometheus seguirá enviando alertas pero Alert Manager suprimirá los mensajes duplicados durante un período especificado para evitar inundar a su equipo con alertas redundantes.
También puede silenciar o inhibir completamente las alertas si es necesario. Una vez que se resuelva el problema subyacente, se enviará un mensaje de recuperación para notificar a sus equipos.
Este ejemplo ilustra un escenario común, pero puede personalizar completamente la configuración para satisfacer sus requisitos específicos.
advertencia
Alert Managerno está incluido por defecto con Prometheus. Para ahorrarle tiempo y simplificar el proceso, hemos integrado y configuradoAlert Manageren Stackhero para Prometheus para que pueda enviar alertas en solo unos minutos, con un esfuerzo mínimo.