Quanto tempo leva pra sua equipe descobrir que o PostgreSQL caiu?
Sexta-feira, 18h. O banco de dados caiu.
Ninguém percebeu até o suporte receber uma enxurrada de tickets. Foram 23 minutos de downtime. O custo? Difícil calcular, mas fácil sentir.
Isso acontece mais do que deveria — e quase sempre pelo mesmo motivo: ninguém estava checando se o PostgreSQL ainda estava no ar.
Monitorar disponibilidade não precisa ser complexo. Um check ativo a cada poucos segundos, um alerta instantâneo quando algo cai, e um histórico pra entender o que aconteceu.
Escrevemos um post explicando o que monitorar e como automatizar isso:
https://argusdba.com/pt/blog/por-que-monitorar-disponibilidade-postgresql/
#Postgres #PostgreSQL #database #dba #sre