Amazon corrige falha que deixou nuvem fora do ar, mas diz que ainda pode haver erro
A AWS (Amazon Web Services) relatou um problema operacional que afetou múltiplos serviços nos EUA, um dos seus principais data centers globais

Os serviços de nuvem da Amazon foram afetados por uma interrupção nesta madrugada de segunda-feira (20), causando instabilidade em diversos aplicativos e programas em todo o mundo, que impactaram Fortnite, Snapchat e serviços corporativos e da própria Amazon como o PrimeVideo e a Alexa.
A AWS (Amazon Web Services) relatou um problema operacional que afetou múltiplos serviços em Virgínia do Norte, nos EUA, um dos seus principais data centers globais. Segundo a companhia, cerca de 500 empresas hospedados na nuvem da Amazon sofreram um apagão, em vários países, incluindo o Brasil.
Por aqui, sites e apps como Mercado Livre, tiveram falha. Em nota, o Mercado Livre e o Mercado Pago reconhecem que houve uma instabilidade em seus aplicativos. "Nossos times trabalharam rapidamente para restabelecer o sistema, que já opera normalmente", afirma o comunicado à imprensa.
Os usuários começaram a relatar problemas por volta das 3h30 (horário de Brasília) desta segunda. Às 7h35, a AWS informou que a "maioria das operações de serviços" voltou a funcionar, pediu os usuários que limpassem o cache e reiniciassem os serviços impactados, mas alertou que falhas "pontuais" ainda estavam ocorrendo.
Às 9h48, a empresa divulgou que havia corrigido outro sistema que caiu, mas que alguns serviços ainda poderiam apresentar lentidão e que a AWS trabalhava para diminuir a fila de solicitações. Parte das empresas afetadas também disseram que os serviços foram restabelecidos.
A interrupção da AWS é a primeira grande perturbação da internet desde o mau funcionamento da CrowdStrike no ano passado, que paralisou sistemas tecnológicos em hospitais, bancos e aeroportos globalmente.
Entre os serviços impactados da computação em nuvem estavam empresas de diferentes ramos como jogos populares como Fortnite e Roblox, a rede social Snapchat, a corretora de criptomoedas americana Coinbase, o mecanismo de busca de inteligência artificial Perplexity, os serviços de dados do London Stock Exchange Group, o site de venda de ingressos do time inglês de futebol Tottenham e o app de transporte Lyft.
No Downdetector (site que monitora problemas de funcionamento), usuários reclamaram da AWS em vários países pelo mundo e também reportaram problemas nos sites que têm os seus serviços veiculados à companhia.
A Ookla, proprietária do Downdetector, disse que mais de 4 milhões de usuários relataram problemas devido ao incidente.
A AWS é líder global em serviços de computação em nuvem e fornece armazenamento de dados e outros serviços digitais para empresas, governos e indivíduos. Interrupções em seus servidores podem causar falhas em sites e plataformas que dependem de sua infraestrutura em nuvem. A AWS supera os rivais do Google e da Microsoft.
A unidade de nuvem é um importante gerador de lucro para a gigante do comércio eletrônico, que investe dezenas de bilhões de dólares na expansão de data centers para treinar e implementar aplicativos com inteligência artificial.
Ainda não ficou claro se todos os problemas relatados globalmente estavam diretamente ligados às falhas da AWS.
O QUE OCORREU
Os primeiros relatos de falhas começaram por volta das 3h30 (de Brasília). Às 4h11, a AWS informou que investigava "aumento nas taxas de erro e latências" e que trabalhava para o restabelecimento.
Às 5h26, a companhia relatou que o erro impedia que os usuários abrissem ou atualizações notificações de falhas junto ao suporte da AWS. Cerca de 30 minutos depois, a companhia relatou que a origem seria o servidor na Vírginia do Norte, nos EUA. Às 6h22, a AWS instruiu os usuários a reiniciar os serviços, que já estavam voltando a funcionar.
Em novo comunicado, divulgado às 7h35, a AWS informou que a "maioria das operações de serviços" voltou a funcionar e pediu os usuários que limpassem o cache e reiniciassem os serviços impactados. Porém, a empresa alertou que "falhas pontuais" ainda poderiam ocorrer, apesar de o problema que gerou o DNS (quando o servidor não responde ao pedido do usuário) ter sido corrigido.
"Serviços da AWS que dependem de SQS Lambda como atualização de políticas corporativas também podem estar apresentando lentidão", afirmou a AWS, em comunicado às 8h48. Cerca de 20 minutos depiis, a empresa divulgou que o SQS Lambda fora corrigido e que trabalhava para o restabelecimento de outro sistema que apresentou falha.
Junade Ali, engenheiro de software, especialista cibernético e membro da Instituição de Engenharia e Tecnologia, disse que o problema parecia estar em um dos sistemas de rede que a AWS usa para controlar um produto de banco de dados.
"Como esse problema geralmente pode ser resolvido de forma centralizada... a menos que haja outros problemas identificados, ele deverá ser mitigado nas próximas horas", afirmou Ali.
CLIENTES IMPACTADOS
Alguns dos jogos mais populares do mundo como Fortnite, Roblox, Clash Royale e Clash of Clans ficaram fora do ar, assim como as plataformas financeiras Venmo, do Paypal, e Chime.
O CEO da Perplexity, Aravind Srinivas, postou na rede social X (antigo Twitter) e disse que o site trabalhava para resolver a falha. "O Perplexity está fora do ar no momento. A causa raiz é um problema da AWS. Estamos trabalhando para resolvê-lo", disse, durante a madrugada.
Rival da Uber, o aplicativo de transportes Lyft também estava fora do ar para milhares de usuários nos EUA. A presidente do aplicativo de mensagens Signal, Meredith Whittaker, confirmou no X que a plataforma da empresa também foi afetada pela interrupção da AWS.
Na Inglaterra, o Lloyd Bank, o Bank of Scotland, os provedores de serviços de telecomunicações Vodafone e BT, e o site de venda de ingressos do time de futebol Tottenham ficaram fora do ar devido à instabilidade na AWS, assim como foi relatado problemas pela autoridade tributária, de pagamentos e alfandegária britânica HMRC.
Ainda na manhã de segunda, empresas como Coinbase, Perplexity, Fortnite e HMRC afirmaram que os serviços foram retomados.
O problema destaca o quão interconectados os serviços digitais cotidianos se tornaram e o quanto eles dependem agora de um pequeno número de provedores globais de nuvem, com uma falha causando estragos nos negócios e na vida cotidiana, disseram especialistas e acadêmicos.
"O principal motivo para esse problema é que todas essas grandes empresas dependem de apenas um serviço", comentou Nishanth Sastry, Diretor de Pesquisa do Departamento de Ciência da Computação da Universidade de Surrey.
MATÉRIAS RELACIONADAS:




Comentários