Сбой в работе Microsoft 365: подключение восстановлено после сбоя, связанного с интернет-провайдером, затронувшего тысячи людей
Создано 12 сентября 2024 г. • Новости • 1,304 просмотров • 5 минуты чтения
Сбой в работе Microsoft 365 затронул тысячи людей, подключение восстановлено после того, как интернет-провайдер отменил изменения
12 сентября 2024 года корпорация Microsoft (MSFT.O) сообщила о значительном сбое, который затронул ее широко используемый облачный пакет производительности Microsoft 365, включающий такие популярные приложения, как Word, Excel, Teams и Outlook. Сбой затронул тысячи пользователей по всей территории Соединенных Штатов, и более 90,000 XNUMX отчетов заполонили Downdetector, платформу, отслеживающую сбои в режиме реального времени. Инцидент, вызванный изменением в стороннем поставщике услуг Интернета (ISP), в конечном итоге был устранен, и Microsoft подтвердила, что к середине утра услуги вернулись в нормальное состояние.
Подробности и хронология сбоев
Сбой начался рано утром в четверг, когда пользователи сообщили о невозможности доступа к нескольким службам Microsoft 365, включая Outlook, Teams и различные облачные предложения. Команда по связям с общественностью Microsoft быстро признала наличие проблемы в своей учетной записи X (ранее Twitter), указав, что компания расследует первопричину.
К 9 утра по восточному времени Downdetector зарегистрировал более 23,000 365 сообщений пользователей о трудностях доступа к службам Microsoft 75. Сбой в первую очередь затронул ключевые платформы, такие как Outlook, Teams, SharePoint и Exchange Server, причем примерно XNUMX% зарегистрированных проблем были связаны с Outlook. Другие службы, такие как Skype для бизнеса Server и Microsoft Store, также столкнулись с повышенным количеством сообщений об сбоях.
Проблемы возникли из-за изменения в управляемой среде стороннего интернет-провайдера, на которого Microsoft полагается для подключения. Это изменение вызвало широкомасштабные сбои, затронувшие тысячи пользователей, особенно в регионах, зависящих от инфраструктуры этого конкретного интернет-провайдера. Microsoft тесно сотрудничала с интернет-провайдером, чтобы выявить и устранить проблему, и сторонний поставщик в конечном итоге отменил изменения, что привело к постепенному восстановлению обслуживания.
Действия Microsoft по реагированию и восстановлению
На протяжении всего сбоя Microsoft информировала пользователей через свои каналы социальных сетей и порталы администраторов. В первоначальном заявлении компании говорилось, что она расследует сбой, и настоятельно рекомендовала клиентам следить за обновлениями в центре администрирования Microsoft 365 в рамках инцидента с идентификатором MO888473. Инженеры Microsoft неустанно работали над проверкой сетевой телеметрии и последних изменений, внесенных в сетевую инфраструктуру, что дало ценную информацию о первопричине проблемы.
Важным событием в процессе восстановления стало то, что Microsoft определила изменение ISP как прямую причину сбоя. Сторонний провайдер отменил свое изменение, что привело к заметным признакам восстановления. К 10:30 утра по восточному времени количество сообщений об инцидентах значительно сократилось до менее 2,000, по сравнению с пиковым значением в 23,000 ранее в тот же день.
Microsoft подтвердила, что проблемы с подключением были устранены в последующем сообщении на X, заявив: «Мы можем подтвердить, что проблема, влияющая на подключение к службам Microsoft, теперь устранена». Быстрое выявление проблемы в сочетании с упреждающими мерами, принятыми интернет-провайдером, гарантировали, что сбой был локализован в течение нескольких часов.
Влияние и более широкие последствия
Хотя отключение было относительно недолгим, оно затронуло значительное количество пользователей и организаций, которые в своей повседневной работе активно используют Microsoft 365. Microsoft 365 является неотъемлемой частью бизнеса в различных секторах, предоставляя необходимые инструменты для общения, совместной работы и производительности. Отключение временно нарушило рабочий процесс предприятий, школ и других учреждений, вызвав массовые неудобства.
Этот инцидент также привлек внимание к зависимости облачных сервисов от сторонней инфраструктуры. Зависимость от интернет-провайдеров и других внешних поставщиков услуг означает, что даже небольшие изменения в этих средах могут иметь волновые эффекты, как это было показано в этом случае. Несмотря на надежные внутренние системы Microsoft, внешние факторы остаются потенциальными точками отказа для облачных сервисов.
Сбой произошел всего через два месяца после другого значительного сбоя, связанного с фирмой по кибербезопасности CrowdStrike. В июле неисправное обновление программного обеспечения от CrowdStrike затронуло почти 8.5 миллионов устройств Windows, парализовав операции в таких отраслях, как авиалинии, банковское дело и здравоохранение. Этот предыдущий инцидент выявил уязвимости в экосистеме Microsoft, и многие пользователи провели параллели между двумя сбоями. Однако, в отличие от июльского инцидента, этот недавний сбой был устранен быстрее благодаря оперативному ответу интернет-провайдера, который отменил изменение, вызвавшее проблему.
Сотрудничество Microsoft и интернет-провайдеров
Пока Microsoft занималась этой проблемой, AT&T (TN), один из крупнейших интернет-провайдеров в США, подтвердил свою роль в сбое. Представитель AT&T признал кратковременное нарушение связи с некоторыми службами Microsoft в своей сети, но заверил клиентов, что проблема была быстро решена.
«Мы столкнулись с кратковременным сбоем в подключении к некоторым службам Microsoft в нашей сети. Проблема устранена, и соединения работают нормально», — сообщил представитель AT&T.
Сотрудничество Microsoft с такими интернет-провайдерами, как AT&T, подчеркивает сложную взаимозависимость между крупными технологическими компаниями и их инфраструктурными партнерами. Поскольку цифровой ландшафт продолжает расти, эти партнерства имеют важное значение для предоставления бесшовных облачных сервисов миллионам пользователей. Однако они также вносят уязвимости, как это видно из этого сбоя, когда изменения, внесенные интернет-провайдером, могут напрямую повлиять на функциональность облачных сервисов, таких как Microsoft 365.
Реакции клиентов и отчеты Downdetector
Downdetector, который собирает отправленные пользователями отчеты и другие источники данных для мониторинга сбоев, сыграл ключевую роль в отслеживании масштаба сбоя. На пике своего развития платформа зарегистрировала более 90,000 XNUMX отчетов для различных служб Microsoft, включая Azure, Teams, Xbox, Bing и Microsoft Store. Пользователи выразили свое разочарование в сети, причем многие выразили обеспокоенность частотой сбоев, влияющих на облачные службы.
Некоторые пользователи также выразили обеспокоенность по поводу более широких последствий таких сбоев, особенно для организаций, которые зависят от бесперебойного доступа к инструментам Microsoft 365 для критически важных операций. Сбой подчеркнул важность планирования на случай непредвиденных обстоятельств и стратегий резервного копирования для компаний, в значительной степени зависящих от облачных платформ.
К концу утра Downdetector сообщил о значительном снижении количества сообщений об отключении, что стало сигналом возвращения к нормальной жизни для большинства пользователей. По состоянию на 10:28 утра по восточному времени количество сообщений об инцидентах сократилось примерно до 800, по сравнению с десятками тысяч, зафиксированными ранее в тот же день. Это быстрое снижение количества сообщений отражало успешное устранение отключения и восстановление нормального обслуживания.
Хотя отключение Microsoft 12 2024 сентября 365 года было кратковременным, оно послужило напоминанием о сложностях и уязвимостях, присущих облачной доставке услуг. Инцидент, вызванный изменением управляемой среды интернет-провайдера, нарушил работу тысяч пользователей, прежде чем был быстро устранен. Быстрое реагирование Microsoft в сочетании с сотрудничеством интернет-провайдера обеспечило восстановление услуг в течение нескольких часов.
Поскольку зависимость от облачных платформ продолжает расти, растет и важность надежной инфраструктуры и планов действий в чрезвычайных ситуациях для предотвращения и смягчения сбоев. Хотя Microsoft быстро решила эту проблему, инцидент подчеркивает необходимость постоянного сотрудничества между технологическими компаниями и их внешними партнерами для минимизации сбоев и обеспечения бесперебойной доставки услуг.
Популярные записи
-
-
-
Meta представляет Orion: будущее очков дополненной реальности• 1,859 просмотров
-
-