Executando verificação de segurança...
3

Amazon divulga relatório sobre pane global da AWS

A Amazon publicou um relatório detalhando como uma falha crítica no sistema de gerenciamento de DNS do DynamoDB desencadeou uma interrupção na AWS que afetou diversos sites e serviços.

De acordo com a empresa, a causa raiz foi uma “race condition” no sistema automatizado de DNS do DynamoDB, que resultou em um registro DNS vazio para o endpoint regional EAST-US-1.

O problema começou com uma falha de sincronização entre dois componentes automáticos do sistema: o DNS Planner, que monitora os balanceadores de carga e cria novos planos de DNS, e o DNS Enactor, responsável por aplicar essas alterações por meio do Amazon Route 53, serviço da AWS que gerencia nomes de domínio e direciona o tráfego de internet.

Durante o incidente, um dos DNS Enactors apresentou atraso incomum, enquanto o DNS Planner continuou gerando novos planos e um segundo DNS Enactor começou a aplicá-los normalmente. Quando o primeiro componente concluiu sua execução atrasada, o segundo iniciou um processo de limpeza que removeu planos antigos considerados obsoletos, apagando inadvertidamente o plano ativo e eliminando todos os endereços IP do endpoint regional do DynamoDB.

Essa inconsistência impediu que os DNS Enactors atualizassem os registros corretamente, fazendo com que vários serviços da AWS perdessem acesso ao DynamoDB e provocando uma interrupção global.

Como medida corretiva, a AWS desativou temporariamente a automação do DNS Planner e do DNS Enactor do DynamoDB até a implementação de proteções que evitem a repetição da condição de corrida.

Carregando publicação patrocinada...
0