Executando verificação de segurança...
0

Quanto tempo leva pra sua equipe descobrir que o PostgreSQL caiu?

Sexta-feira, 18h. O banco de dados caiu.

Ninguém percebeu até o suporte receber uma enxurrada de tickets. Foram 23 minutos de downtime. O custo? Difícil calcular, mas fácil sentir.

Isso acontece mais do que deveria — e quase sempre pelo mesmo motivo: ninguém estava checando se o PostgreSQL ainda estava no ar.

Monitorar disponibilidade não precisa ser complexo. Um check ativo a cada poucos segundos, um alerta instantâneo quando algo cai, e um histórico pra entender o que aconteceu.

Escrevemos um post explicando o que monitorar e como automatizar isso:
https://argusdba.com/pt/blog/por-que-monitorar-disponibilidade-postgresql/

#Postgres #PostgreSQL #database #dba #sre

Carregando publicação patrocinada...
1

Eu estou desenvolvendo uma coisa assim, pra poder sempre impedir que o db caia de alguma forma, ver o que está em uso, ver as queries mais usadas, ver os clients mais ofensivos pro db, simplesmente uma ferramenta pra observar e restringir um db, tudo no CLI, sem muita complexidade. Só que eu estou com pouco de dificuldades pra criar, eu acho que é minha falta de preparar e planejar mais um projeto, ent eu acho que vai ser tanto um bom projeto para os outros tanto para mim. Caso queira ver: https://github.com/DotNicolasPenha/Metrics-Tracker, ainda tá sem readme sem nada, só um início de um código.

1

Quanto tempo leva pra sua equipe descobrir que o PostgreSQL caiu?

Menos que 2 minutos, o mesmo tempo para eu ser alertado caso qualquer container da minha infraestrutura tenha qualquer problema, Mestre akita fez um tutorial muito bom de Grafana + cadvisor