Graylog: Introduction

Introduction à Graylog, tout ce qu'il faut savoir

👋 Bienvenue sur la documentation de Stackhero !

Stackhero propose une solution Graylog cloud prête à l'emploi qui offre de nombreux avantages, notamment :

  • Serveur SMTP d'e-mail dédié et illimité inclus.
  • Mises à jour simplifiées en un clic.
  • Nom de domaine personnalisable sécurisé par HTTPS (par exemple, https://logs.votre-entreprise.com).
  • Performance optimale et sécurité renforcée grâce à une VM privée et dédiée.

Gagnez du temps et simplifiez-vous la vie : il suffit de 5 minutes pour essayer la solution Graylog cloud hosting de Stackhero !

Graylog est une plateforme open source de gestion des logs qui offre aux équipes d'ingénierie et d'exploitation un point central pour collecter, stocker, rechercher et analyser les données de logs issues de l'ensemble de leur infrastructure. Plutôt que de se connecter en SSH sur chaque serveur pour lire les fichiers de logs un à un, vous centralisez tous vos logs dans Graylog, où ils sont indexés en temps réel et consultables en quelques millisecondes, même sur des milliards d'événements.

La plateforme repose sur trois fonctionnalités principales. D'abord, elle collecte les logs depuis pratiquement n'importe quelle source — serveurs, applications, conteneurs, équipements réseau, services cloud — via des protocoles standards comme Syslog, GELF, Beats, TCP/UDP brut et HTTP. Ensuite, elle indexe ces données dans un moteur OpenSearch intégré, rendant chaque champ immédiatement interrogeable. Enfin, elle analyse les données via une interface web qui propose la recherche plein texte, des tableaux de bord personnalisables, des règles d'alerte et des pipelines de traitement capables d'enrichir, filtrer et router les événements de logs en temps réel.

Graylog a été créé en 2010 par Lennart Koopmann à Hambourg, en Allemagne. Le projet a débuté comme un outil personnel de gestion centralisée des logs et a été publié en open source en 2012 sous le nom GELF (Graylog Extended Log Format). Il a rapidement séduit les communautés DevOps et infrastructure, et Graylog, Inc. a été fondée pour proposer une offre commerciale autour du noyau open source.

La société a son siège à Houston, Texas, avec des bureaux à Londres et Hambourg. Elle a levé d'importants fonds auprès d'investisseurs au fil des années et accompagne aujourd'hui des milliers d'organisations dans le monde, des startups aux grandes entreprises et organismes publics.

Graylog est utilisé par les équipes d'ingénierie et d'exploitation dans de nombreux contextes. Le cas d'usage le plus courant est le debug en production : lorsqu'un incident survient, les ingénieurs doivent pouvoir rechercher dans les logs de dizaines de services en même temps, sans avoir à parcourir les fichiers sur chaque machine. Graylog rend cette recherche instantanée.

Au-delà du debug, les équipes utilisent Graylog pour la supervision de l'infrastructure — en configurant des alertes qui se déclenchent lors de pics d'erreurs, d'arrêts de services ou de détection de comportements inhabituels dans les logs. Les équipes sécurité s'en servent pour l'audit et la conformité, en suivant les tentatives d'authentification, les accès et les anomalies sur l'ensemble du système, et en conservant les logs selon les durées requises par le RGPD, ISO 27001, SOC 2 ou HIPAA. Les équipes plateforme l'utilisent pour corréler les événements entre différents systèmes — serveurs web, bases de données, load balancers, pods Kubernetes — dans une seule timeline consultable.

Graylog agit comme un hub central entre votre infrastructure et votre équipe. Les collecteurs de logs — Filebeat, Fluentd, rsyslog ou les bibliothèques clientes GELF natives — récupèrent les logs de vos systèmes et les transmettent aux points d'entrée de Graylog. Graylog traite ensuite chaque message entrant via des pipelines configurables qui peuvent parser les champs, appliquer des transformations, enrichir les événements avec des données geo-IP ou des tables de correspondance, et router les messages vers les bons streams.

Les messages traités sont indexés par OpenSearch, inclus avec Graylog, qui prend en charge la recherche plein texte. MongoDB, également intégré, stocke la configuration de Graylog — streams, tableaux de bord, utilisateurs, règles d'alerte et définitions de pipelines. Votre équipe accède à l'ensemble via l'interface web de Graylog, pour lancer des recherches à la volée, créer des dashboards, configurer des alertes et investiguer les incidents. Vous disposez ainsi d'une vue unifiée sur tous vos logs, avec des recherches en moins d'une seconde, même à grande échelle.

Graylog existe en deux éditions. Graylog Open est l'édition communautaire — gratuite, y compris en production. Elle couvre les besoins essentiels de gestion des logs : collecte, indexation, recherche, dashboards, streams, pipelines et alertes de base. Le code source est disponible sur GitHub. Graylog Operations et Graylog Security sont des éditions commerciales qui ajoutent des fonctionnalités comme la détection d'anomalies, les rapports de conformité, des règles de corrélation avancées et un support entreprise.

Un point important concernant la licence : en 2023–2024, Graylog a changé la licence de son code principal, passant de l'Apache 2.0 à la Server Side Public License (SSPL). Pour la grande majorité des utilisateurs — entreprises qui exploitent Graylog en interne pour leurs propres logs — ce changement n'a aucun impact pratique. Vous pouvez continuer à utiliser Graylog Open gratuitement. La SSPL concerne principalement les organisations qui souhaitent proposer Graylog en service hébergé à des tiers. Si vous aviez besoin spécifiquement de la licence Apache 2.0, la dernière version concernée est Graylog 5.0 ; les versions 5.1 et suivantes sont sous SSPL.

Graylog est la solution idéale lorsque votre équipe doit centraliser les logs de plusieurs serveurs, services ou applications dans une interface de recherche unique. Si vos ingénieurs passent du temps à se connecter en SSH pour diagnostiquer des incidents en production, ou si vous manquez de visibilité en temps réel sur votre infrastructure, Graylog répond directement à ce besoin.

C'est aussi un excellent choix si vous avez besoin d'alertes en temps réel sur des motifs dans les logs — pics d'erreurs, échecs de connexion, interruptions de service — ou si vous devez conserver les logs pour des raisons de conformité ou d'audit. Graylog est particulièrement adapté aux équipes qui recherchent une interface de gestion des logs dédiée, sans la complexité d'assembler et maintenir plusieurs outils distincts.

Graylog est conçu spécifiquement pour la gestion des logs. Si votre besoin principal est de stocker et interroger des métriques temporelles — utilisation CPU, latence des requêtes, consommation mémoire — une base de données spécialisée comme InfluxDB ou Prometheus sera plus adaptée. Graylog est optimisé pour les événements de logs, pas pour les mesures numériques à haute fréquence que les bases de métriques gèrent efficacement.

Graylog présente plusieurs avantages majeurs par rapport à une stack de gestion des logs assemblée manuellement :

  1. Tout-en-un : OpenSearch et MongoDB sont inclus et préconfigurés — inutile d'installer, configurer et maintenir trois services séparés.
  2. Recherche puissante : Recherche plein texte sur des milliards d'événements en quelques millisecondes, grâce au langage de requête Graylog (GQL) simple à utiliser, sans syntaxe complexe à apprendre.
  3. Streams et pipelines : Routage et transformation des logs en temps réel — filtrage du bruit, enrichissement des champs, envoi d'événements spécifiques vers des destinations précises, sans avoir à écrire de code personnalisé.
  4. Alerting intégré : Conditions d'alerte et notifications par e-mail, Slack, PagerDuty, etc., directement intégrées à Graylog — pas besoin d'un outil d'alerte séparé.
  5. Dashboards : Création de tableaux de bord visuels directement dans l'interface web Graylog, sans couche de visualisation supplémentaire comme Grafana ou Kibana.
  6. Ingestion multi-protocole : Prise en charge des logs via Syslog, GELF, Beats, TCP/UDP brut, HTTP, etc. — compatible avec pratiquement tous les collecteurs de logs déjà présents dans votre infrastructure.

Graylog cloud désigne un déploiement managé de Graylog proposé par un fournisseur cloud, plutôt qu'une installation sur site. L'auto-hébergement de Graylog nécessite de faire tourner trois services ensemble — Graylog, OpenSearch et MongoDB — et de maintenir leur mise à jour, sauvegarde et sécurité, ce qui représente une charge opérationnelle non négligeable.

Avec Stackhero, vous pouvez disposer d'une instance Graylog dédiée opérationnelle en seulement 2 minutes. OpenSearch et MongoDB sont inclus et préconfigurés. Votre instance fonctionne sur une VM dédiée — pas d'infrastructure partagée — garantissant l'isolation de vos données de logs. Les connexions sont chiffrées en TLS 1.3, les sauvegardes sont automatiques toutes les 24 heures et conservées jusqu'à 3 mois, et les mises à jour sont disponibles en un clic. Les serveurs sont disponibles aux États-Unis et en Europe, avec une facturation à l'heure pour ne payer que ce que vous consommez.

Si vous pensez que Graylog est la solution adaptée à votre projet, vous pouvez tester une instance managée préconfigurée et prête à l'emploi en un seul clic. Lancez une instance de démonstration gratuite en moins de 2 minutes et découvrez Graylog sans aucune contrainte. Une fois vos tests validés, la mise à niveau vers une instance prête pour la production est tout aussi simple.

Cliquez ici pour en savoir plus sur Graylog cloud et le démarrer gratuitement.