Interrupção do Microsoft 365: Conectividade restaurada após interrupção relacionada ao ISP afetar milhares
Criado em 12 de setembro de 2024 . Notícias • 1,304 visualizações • 5 minutos de leitura
A interrupção do Microsoft 365 afeta milhares, a conectividade é restaurada após o ISP reverter a alteração
Em 12 de setembro de 2024, a Microsoft Corporation (MSFT.O) relatou uma interrupção significativa que afetou seu pacote de produtividade baseado em nuvem Microsoft 365 amplamente utilizado, que inclui aplicativos populares como Word, Excel, Teams e Outlook. A interrupção impactou milhares de usuários nos Estados Unidos, com mais de 90,000 relatórios inundando o Downdetector, uma plataforma que rastreia interrupções em tempo real. O incidente, causado por uma mudança em um Provedor de Serviços de Internet (ISP) de terceiros, foi finalmente resolvido, com a Microsoft confirmando que os serviços haviam retornado ao normal no meio da manhã.
Detalhes e cronograma da interrupção
A interrupção começou na manhã de quinta-feira, com usuários relatando uma incapacidade de acessar vários serviços do Microsoft 365, incluindo Outlook, Teams e várias ofertas baseadas em nuvem. A equipe de comunicação da Microsoft rapidamente reconheceu o problema em sua conta X (anteriormente Twitter), indicando que a empresa estava investigando a causa raiz.
Às 9h ET, o Downdetector havia registrado mais de 23,000 relatórios de usuários sobre dificuldades para acessar os serviços do Microsoft 365. A interrupção impactou principalmente plataformas importantes como Outlook, Teams, SharePoint e Exchange Server, com aproximadamente 75% dos problemas relatados relacionados ao Outlook. Outros serviços como o Skype for Business Server e a Microsoft Store também apresentaram relatórios de interrupção elevados.
Os problemas surgiram de uma mudança no ambiente gerenciado de um ISP terceirizado do qual a Microsoft depende para conectividade. Essa mudança desencadeou interrupções generalizadas, afetando milhares de usuários, particularmente em regiões que dependem da infraestrutura desse ISP específico. A Microsoft trabalhou em estreita colaboração com o ISP para identificar e resolver o problema, e o provedor terceirizado eventualmente reverteu as mudanças, o que levou à recuperação gradual do serviço.
Esforços de resposta e recuperação da Microsoft
Durante toda a interrupção, a Microsoft manteve os usuários informados por meio de seus canais de mídia social e portais de administração. A declaração inicial da empresa indicou que estava investigando a interrupção, pedindo aos clientes que monitorassem as atualizações no centro de administração do Microsoft 365 sob o ID de incidente MO888473. Os engenheiros da Microsoft trabalharam incansavelmente para revisar a telemetria da rede e as mudanças recentes feitas na infraestrutura de rede, o que forneceu insights valiosos sobre a causa raiz do problema.
Um desenvolvimento importante no processo de recuperação ocorreu quando a Microsoft identificou a mudança do ISP como a causa direta da interrupção. O provedor terceirizado reverteu sua mudança, resultando em sinais perceptíveis de recuperação. Às 10h30 ET, os relatórios de incidentes caíram significativamente para menos de 2,000, abaixo do pico de 23,000 no início do dia.
A Microsoft confirmou que os problemas de conectividade foram mitigados em uma postagem de acompanhamento no X, afirmando: "Podemos confirmar que o problema que afeta a conectividade com os serviços da Microsoft agora foi mitigado". A rápida identificação do problema, combinada com medidas proativas tomadas pelo ISP, garantiu que a interrupção fosse contida em poucas horas.
Impacto e implicações mais amplas
Embora a interrupção tenha durado relativamente pouco, ela impactou um número significativo de usuários e organizações que dependem muito do Microsoft 365 para operações diárias. O Microsoft 365 é essencial para empresas em vários setores, fornecendo ferramentas essenciais para comunicação, colaboração e produtividade. A interrupção interrompeu temporariamente as rotinas de trabalho de empresas, escolas e outras instituições, causando inconveniências generalizadas.
Este incidente também chamou a atenção para as dependências de serviços baseados em nuvem em infraestrutura de terceiros. A dependência de ISPs e outros provedores de serviços externos significa que mesmo pequenas mudanças dentro desses ambientes podem ter efeitos cascata, como visto neste caso. Apesar dos sistemas internos robustos da Microsoft, fatores externos continuam sendo pontos potenciais de falha para serviços de nuvem.
A interrupção ocorre apenas dois meses após outra interrupção significativa envolvendo a empresa de segurança cibernética CrowdStrike. Em julho, uma atualização de software defeituosa da CrowdStrike afetou quase 8.5 milhões de dispositivos Windows, prejudicando operações em setores como companhias aéreas, bancos e assistência médica. Este incidente anterior expôs vulnerabilidades dentro do ecossistema da Microsoft, com muitos usuários traçando paralelos entre as duas interrupções. No entanto, diferentemente do incidente de julho, esta interrupção recente foi resolvida mais rapidamente, graças à pronta resposta do ISP em reverter a alteração que causou o problema.
Colaboração entre Microsoft e ISP
Enquanto a Microsoft abordava o problema, a AT&T (TN), uma das maiores ISPs dos EUA, confirmou seu papel na interrupção. Um porta-voz da AT&T reconheceu a breve interrupção na conectividade de alguns serviços da Microsoft em sua rede, mas garantiu aos clientes que o problema foi resolvido rapidamente.
"Tivemos uma breve interrupção na conexão com alguns serviços da Microsoft em nossa rede. O problema foi resolvido e as conexões estão operando normalmente", disse o representante da AT&T.
A colaboração da Microsoft com ISPs como a AT&T destaca as complexas interdependências entre as principais empresas de tecnologia e seus parceiros de infraestrutura. À medida que o cenário digital continua a crescer, essas parcerias são essenciais para fornecer serviços de nuvem contínuos a milhões de usuários. No entanto, elas também introduzem pontos de vulnerabilidade, como visto nesta interrupção, onde as alterações feitas por um ISP podem impactar diretamente a funcionalidade de serviços de nuvem como o Microsoft 365.
Reações do cliente e relatórios do Downdetector
O Downdetector, que agrega relatórios enviados por usuários e outras fontes de dados para monitorar interrupções, desempenhou um papel fundamental no rastreamento da escala da interrupção. No seu pico, a plataforma registrou mais de 90,000 relatórios para vários serviços da Microsoft, incluindo Azure, Teams, Xbox, Bing e Microsoft Store. Os usuários expressaram suas frustrações online, com muitos expressando preocupações sobre a frequência de interrupções que afetam os serviços baseados em nuvem.
Alguns usuários também levantaram preocupações sobre as implicações mais amplas de tais interrupções, particularmente para organizações que dependem de acesso ininterrupto às ferramentas do Microsoft 365 para operações críticas. A interrupção ressaltou a importância do planejamento de contingência e estratégias de backup para empresas fortemente dependentes de plataformas baseadas em nuvem.
No final da manhã, o Downdetector relatou uma redução significativa nos relatórios de interrupção, sinalizando um retorno à normalidade para a maioria dos usuários. Às 10:28 am ET, os relatórios de incidentes caíram para cerca de 800, abaixo das dezenas de milhares vistas no início do dia. Esse rápido declínio nos relatórios refletiu a resolução bem-sucedida da interrupção e a restauração do serviço normal.
Embora a interrupção do Microsoft 12 em 2024 de setembro de 365 tenha durado pouco, ela serviu como um lembrete das complexidades e vulnerabilidades inerentes à entrega de serviços baseados em nuvem. O incidente, causado por uma mudança de ambiente gerenciado de um ISP, interrompeu milhares de usuários antes de ser rapidamente mitigado. A resposta rápida da Microsoft, combinada com a cooperação do ISP, garantiu que os serviços fossem restaurados em poucas horas.
À medida que a dependência de plataformas baseadas em nuvem continua a crescer, também cresce a importância de uma infraestrutura robusta e planos de contingência para prevenir e mitigar interrupções. Embora a Microsoft tenha resolvido esse problema rapidamente, o incidente destaca a necessidade de colaboração contínua entre empresas de tecnologia e seus parceiros externos para minimizar interrupções e garantir a entrega de serviços sem interrupções.
Publicações Populares
-
-
OpenAI lança novo modelo de IA “o1” com recursos avançados de raciocínio• 1,876 visualizações
-
Meta revela Orion: o futuro dos óculos de realidade aumentada• 1,859 visualizações
-
-