Prometheus: Introduction

Comment fonctionne Prometheus

👋 Bienvenue sur la documentation de Stackhero !

Stackhero propose une solution Prometheus cloud prête à l'emploi qui offre de nombreux avantages, notamment :

  • Alert Manager inclus pour envoyer des alertes vers Slack, Mattermost, PagerDuty, etc.
  • Serveur email dédié pour envoyer un nombre illimité d'alertes par e-mail.
  • Blackbox pour sonder HTTP, ICMP, TCP et bien plus.
  • Configuration simple grâce à l'éditeur de fichier de configuration en ligne.
  • Mises à jour faciles en un clic.
  • Performance optimale et sécurité renforcée grâce à une VM privée et dédiée.

Gagnez du temps et simplifiez-vous la vie : il suffit de 5 minutes pour essayer la solution Prometheus cloud hosting de Stackhero !

Prometheus est un système de monitoring hautement adaptable et fiable, conçu pour renforcer la performance et la fiabilité de différentes infrastructures. Il s'intègre facilement à divers environnements, qu'il s'agisse de serveurs physiques, de machines virtuelles ou d'équipements réseau. Prometheus collecte et traite des métriques provenant de cibles prédéfinies, ce qui permet de générer des alertes selon des conditions spécifiques afin de vous tenir informé de l'état de votre système.

L'Alert Manager, inclus dans votre instance Stackhero Prometheus, facilite la configuration des notifications d'alerte. Ces alertes peuvent être paramétrées pour fonctionner avec des outils de communication largement utilisés comme e-mail, Slack, PagerDuty, OpsGenie, et d'autres. Lorsqu'il est intégré à Grafana, Prometheus devient une suite de monitoring complète, offrant des tableaux de bord interactifs pour une visualisation et une analyse efficaces des métriques.

Vue d'ensemble de Stackhero pour PrometheusVue d'ensemble de Stackhero pour Prometheus

Prometheus propose des fonctionnalités de monitoring à travers des composants essentiels et complémentaires. Voici les principaux éléments :

  • Prometheus Server :

    • Collecte périodiquement les métriques auprès des targets (exporters) via HTTP.
    • Stocke ces métriques dans sa base de données interne de séries temporelles.
    • Evalue les règles d'alerte pour générer des notifications selon des seuils définis.
  • Alert Manager :

    • Gère les alertes générées par Prometheus.
    • Agrège, déduplique et transmet ces alertes vers vos canaux de communication préférés.
  • Blackbox Exporter :

    • Teste la disponibilité et la performance des endpoints en utilisant des protocoles comme HTTP(S), DNS, TCP et ICMP.
  • Node Exporter :

    • Fournit à Prometheus des métriques matérielles et système pour les serveurs Linux.
  • Grafana :

    • Une plateforme de visualisation qui complète Prometheus, permettant de créer des tableaux de bord dynamiques et personnalisables pour une analyse détaillée des données.

Vous pouvez gérer les configurations de Prometheus, Alert Manager et Blackbox à l'aide de fichiers de configuration YAML. Ces fichiers sont accessibles et modifiables directement depuis votre tableau de bord Stackhero. Après chaque modification, les changements sont appliqués automatiquement, garantissant une configuration fluide sans nécessiter de redémarrage des services.

En cas d'erreur dans un fichier de configuration, les modifications ne seront pas appliquées. Pour diagnostiquer le problème, vous pouvez consulter les logs d'erreur disponibles dans la section "logs" de votre service Prometheus sur le tableau de bord Stackhero.

A chaque modification d'un fichier de configuration, une sauvegarde est automatiquement créée et stockée dans un répertoire dédié aux sauvegardes. Le système conserve les cinq sauvegardes les plus récentes ou celles créées au cours des 14 derniers jours, en supprimant automatiquement les plus anciennes.

Vous pouvez accéder à ces sauvegardes à l'URL suivante : https://<yourServiceDomain>/configurations/files/backups/.

Si vous souhaitez supprimer des séries temporelles spécifiques enregistrées dans Prometheus, vous pouvez utiliser l'admin API. Par exemple, pour supprimer les données associées à un job nommé oldJob, vous pouvez utiliser la commande suivante :

curl -u admin -X POST -g 'https://<yourServiceDomain>/api/v1/admin/tsdb/delete_series?match[]={job="oldJob"}'

Une fois les données supprimées, il n'est pas possible de les restaurer. Assurez-vous de disposer de sauvegardes complètes et procédez avec précaution lors de cette opération.

Pour plus d'informations, consultez la documentation officielle de Prometheus.