Prometheus: Introdução aos alertas do Prometheus

Esta documentação faz parte do guia Alertas. Consulte o guia completo aqui: Como funcionam os alertas do Prometheus e como configurá-los.

👋 Bem-vindo à documentação da Stackhero!

A Stackhero oferece uma solução Prometheus cloud pronta a usar que proporciona uma série de benefícios, incluindo:

  • Alert Manager incluído para enviar alertas para Slack, Mattermost, PagerDuty, etc.
  • Servidor de email dedicado para enviar alertas de email ilimitados.
  • Blackbox para sondar HTTP, ICMP, TCP, e mais.
  • Configuração fácil com editor de ficheiros de configuração online.
  • Atualizações sem esforço com apenas um clique.
  • Desempenho ótimo e segurança robusta alimentados por uma VM privada e dedicada.

Poupe tempo e simplifique a sua vida: leva apenas 5 minutos para experimentar a solução de hospedagem cloud Prometheus da Stackhero!

O Prometheus pode analisar as suas métricas e acionar alertas com base em regras que definir. Com o Stackhero para Prometheus, os alertas são processados em duas etapas. Primeiro, as regras de alerta do Prometheus são avaliadas e depois o Alert Manager assume.

Tudo está pré-instalado e configurado com o Stackhero para Prometheus, por isso só precisa de realizar uma configuração mínima, como adicionar o seu endereço de email, para começar a receber alertas.

Visão geral do Stackhero para PrometheusVisão geral do Stackhero para Prometheus

Quando o Prometheus recupera métricas, avalia-as em relação às regras especificadas no ficheiro rules-alert.yml. Estas regras de alerta definem limites e janelas de tempo para acionar alertas com base nas métricas recolhidas.

Por exemplo, um alerta pode ser acionado se a utilização do disco exceder 80%. Além disso, podem ser configuradas regras para prever condições futuras e enviar um alerta se estimar que o espaço em disco será completamente preenchido nas próximas 24 horas.

Outro caso de uso comum envolve a deteção de comportamento incomum. Por exemplo, se houver um aumento repentino no uso da largura de banda da rede, um alerta pode ser acionado para ajudar a detetar potenciais ataques de negação de serviço distribuído (DDoS) ou tentativas de exfiltração de dados.

As regras de alerta do Prometheus estão incluídas diretamente no servidor Prometheus.

O Alert Manager recebe alertas que as regras de alerta do Prometheus acionaram. Ele desduplicará alertas, agrupa-os e depois encaminha-os através de vários canais de notificação, como email, Slack, Mattermost, PagerDuty, entre outros. O seu ficheiro de configuração é alert-manager.yml.

Por exemplo, se ocorrer uma desaceleração do servidor, as regras de alerta do Prometheus podem acionar alertas separados para carga aumentada e uso de CPU. O Alert Manager recebe esses alertas, agrupa-os pois estão relacionados ao mesmo servidor, e envia uma notificação consolidada ao destinatário ou equipa apropriada com base na sua configuração.

Se a desaceleração continuar, o Prometheus continuará a enviar alertas, mas o Alert Manager suprimirá mensagens duplicadas por um período especificado para evitar sobrecarregar a sua equipa com alertas redundantes.

Também pode silenciar ou inibir completamente alertas, se necessário. Uma vez resolvido o problema subjacente, uma mensagem de recuperação é enviada para notificar as suas equipas.

Este exemplo ilustra um cenário comum, mas pode personalizar totalmente a configuração para atender às suas necessidades específicas.

aviso O Alert Manager não está incluído por padrão com o Prometheus. Para poupar tempo e simplificar o processo, integrámos e configurámos o Alert Manager no Stackhero para Prometheus para que possa enviar alertas em apenas alguns minutos, com um esforço mínimo.