Microsoft признала, что глобальный сбой в сетевой инфраструктуре компании, который длился почти пять часов, был вызван ошибкой сетевых инженеров при внесении изменений в конфигурацию WAN-маршрутизаторов. Изменение
IP-адрес – уникальный сетевой адрес узла в компьютерной сети, который основан на протоколе IP. Работа в сети Интернет требует глобальной уникальности, а осуществление деятельности в локальной сети требует уникальности адреса в пределах сети. В IP-адрес входит две части: номер сети и номер узла.
Существует две версии протокола IP: IPv4 и IPv6. В IPv4 сетевой адрес является 32-битовым числом. IP-адрес записывается в виде четырех десятичных чисел со значением от 0 до 255, разделенных точками. В 6-й версии IP-адрес (IPv6) имеет 128-битовое представление. Адреса разделяются двоеточиями.
Различают статистические и динамические IP-адреса. Статистический адрес назначается пользователей в настройках устройства, или назначается автоматически при подключении устройства к сети. Статистический адрес не может быть присвоен другому устройству. Динамический IP-адрес назначается автоматически при подключении устройства к сети и используется в течении ограниченного промежутка времени, который указывается в назначавшем IP-адрес сервисе.
» data-html=»true» data-original-title=»IP-адрес»>IP-адреса WAN-маршрутизаторов было сделано с помощью команды, которая не была тщательно проверена и приводила к различному поведению на разных сетевых устройствах» — объяснили в Microsoft
Компания заявила, что изменения в конфигурации маршрутизаторов внесли сетевые инженеры в ходе запланированных работ по обновлению IP-адресов на WAN-маршрутизаторах. Однако, из-за неправильно выполненных изменений в конфигурации, начался каскадный сбой WAN-маршрутизаторов Microsoft, которые отключились от других маршрутизаторов в глобальной сети. Обновление таблиц маршрутизации на устройствах привело к исключению из переадресации автономных систем Microsoft и систем управления трафиком, чтобы оптимизировать потоки данных в глобальной сети
25 января 2023 года компания Microsoft сумела восстановить работу всех основных своих сервисов через 4 часа после глобального сбоя. Инцидент затронул миллионы пользователей по всему миру, поскольку причиной стала ошибка в сетевой инфраструктуре компании.
Заказчики и пользователи во время инцидента не имели доступа к множеству сервисов Microsoft, таким как Azure, Microsoft 365, Microsoft Teams, Exchange Online, Outlook, SharePoint Online, OneDrive for Business, Microsoft Graph, Microsoft Store, Xbox, Minecraft и VS Code.
«Между 07:05 UTC и 12:43 UTC 25 января 2023 года у клиентов возникли проблемы с сетевым подключением, проявляющиеся в длительной сетевой задержке и/или тайм-аутах при попытке подключения к ресурсам, размещенным в регионах Azure, а также к другим службам Microsoft, включая Microsoft 365 и Power Platform», — говорится в опубликованном сегодня предварительном отчете Microsoft.
После глобального сбоя сетевые инженеры компании вручную откатили ранее внесённые изменения и все сервисы были успешно восстановлены. В связи с инцидентом, Microsoft решила запретить любые изменения в конфигурации сетевых устройств, которые не соответствуют рекомендациям по безопасности и не прошли проверку на всем парке сетевого оборудования.
Некорректные изменения в сетевых настройках Microsoft привели к потере связи автономной системы компании с 47 другими ASN, включая AS701 UUNET (Verizon), сообщили эксперты из Qrator. Нарушение работы ощущалось во всем мире.