Prometheus: Introduction aux alertes Prometheus

Cette documentation fait partie du guide Alertes. Consultez le guide complet ici : Fonctionnement des alertes Prometheus et configuration.

👋 Bienvenue sur la documentation de Stackhero !

Stackhero propose une solution Prometheus cloud prête à l'emploi qui offre de nombreux avantages, notamment :

  • Alert Manager inclus pour envoyer des alertes vers Slack, Mattermost, PagerDuty, etc.
  • Serveur email dédié pour envoyer un nombre illimité d'alertes par e-mail.
  • Blackbox pour sonder HTTP, ICMP, TCP et bien plus.
  • Configuration simple grâce à l'éditeur de fichier de configuration en ligne.
  • Mises à jour faciles en un clic.
  • Performance optimale et sécurité renforcée grâce à une VM privée et dédiée.

Gagnez du temps et simplifiez-vous la vie : il suffit de 5 minutes pour essayer la solution Prometheus cloud hosting de Stackhero !

Prometheus peut analyser vos métriques et déclencher des alertes selon des règles que vous définissez. Avec Stackhero for Prometheus, les alertes sont traitées en deux étapes. D'abord, les règles d'alerte Prometheus sont évaluées, puis c'est Alert Manager qui prend le relais.

Tout est préinstallé et configuré avec Stackhero for Prometheus, il vous suffit donc d'effectuer une configuration minimale, comme ajouter votre adresse e-mail, pour commencer à recevoir des alertes.

Big picture of Stackhero for PrometheusBig picture of Stackhero for Prometheus

Lorsque Prometheus collecte les métriques, il les évalue selon les règles définies dans le fichier rules-alert.yml. Ces règles d'alerte définissent des seuils et des fenêtres temporelles pour déclencher des alertes en fonction des métriques collectées.

Par exemple, une alerte peut être déclenchée si l'utilisation du disque dépasse 80 %. Il est également possible de configurer des règles pour anticiper des situations futures et envoyer une alerte si l'on estime que l'espace disque sera totalement utilisé dans les 24 prochaines heures.

Un autre cas d'usage courant consiste à détecter des comportements inhabituels. Par exemple, si une augmentation soudaine du trafic réseau est détectée, une alerte peut être envoyée pour aider à identifier une attaque DDoS ou une tentative d'exfiltration de données.

Les règles d'alerte Prometheus sont intégrées directement dans le serveur Prometheus.

Alert Manager reçoit les alertes déclenchées par les règles d'alerte Prometheus. Il déduplique les alertes, les regroupe, puis les transmet via différents canaux de notification comme e-mail, Slack, Mattermost, PagerDuty, et bien d'autres. Son fichier de configuration est alert-manager.yml.

Par exemple, en cas de ralentissement d'un serveur, les règles d'alerte Prometheus peuvent générer des alertes distinctes pour la charge et l'utilisation CPU. Alert Manager reçoit ces alertes, les regroupe car elles concernent le même serveur, puis envoie une notification consolidée au destinataire ou à l'équipe appropriée selon votre configuration.

Si le ralentissement persiste, Prometheus continuera à envoyer des alertes, mais Alert Manager supprimera les messages en double pendant une période définie afin d'éviter de submerger votre équipe avec des alertes redondantes.

Vous pouvez également mettre en silence ou inhiber complètement certaines alertes si besoin. Une fois le problème résolu, un message de rétablissement est envoyé pour informer vos équipes.

Cet exemple illustre un scénario courant, mais vous pouvez personnaliser entièrement la configuration selon vos besoins spécifiques.

Alert Manager n'est pas inclus par défaut avec Prometheus. Pour vous faire gagner du temps et simplifier la gestion, nous avons intégré et configuré Alert Manager dans Stackhero for Prometheus afin que vous puissiez envoyer des alertes en quelques minutes, avec un minimum d'efforts.