С 17 часов 19 августа сервисы "Яндекса" недоступны для пользователей Интернета, проблемы с доступом возникли не только к проектам самого "Яндекса", но и к тем сайтам, которые размещают у себя внешние коды проектов "Яндекса" - карты, Яндекс.Директ, Метрика и другие. В московском офисе компании также пропал доступ к интернету.
Аудитория поиска почти равномерно распределилась между поисковыми системами Google и Mail.ru - по данным Liveinternet.ru, Google стал раздавать на 11000 больше переходов на сайты Рунета в минуту по сравнению с обычными значениями, а Mail.ru на 9000 больше переходов.
На момент публикации материала было частично восстановлено функционирование главной страницы сайта и ряда других сервисов.
UPD: В корпоративном блоге Яндекса появилась информация о причинах сбоя:
Проблема вызвана ошибкой программного обеспечения на маршрутизаторе, расположенном в нашем новом дата-центре в Амстердаме. В Яндексе используются протоколы маршрутизации – внутренний протокол OSPF и внешний протокол BGP. Из-за ошибки информация обо всех внешних маршрутах оказалась во внутренних таблицах маршрутизации. Это примерно на три порядка больше маршрутов, чем обычно. Протокол OSPF не рассчитан на такое количество. В результате у всех маршрутизаторов кончилась память, и они перестали работать. Нарушилась работа сети, и через несколько минут Яндекс стал полностью недоступен.
Внутренняя сеть тоже не работала. Поэтому нашим специалистам потребовалось потратить много времени для того, чтобы по цепочке добраться до источника проблемы.
Администраторы исправили ошибку на маршрутизаторе. После этого, чтобы снять лишнюю нагрузку с остальных маршрутизаторов, которых у нас больше сотни, нашим специалистам пришлось разделить сеть на несколько частей. Количество трафика снизилось, у маршрутизаторов появилось больше свободной памяти, и они смогли самостоятельно восстановить связность сети.
Сеть начала постепенно подниматься. Через некоторое время сервисы Яндекса стали доступны большей части пользователей.
sinodov> Просто иногда, относительно редко, юзеру показывали «ничего не найдено». имхо, реакция пользователей ПС на «сайт не грузится» и «ничего не найдено» будет сильно отличаться. пользователи, на самом деле, весьма терпимы к падениями сайтов, а вот «ничего не найдено» — это, фактически, признание поражения ПС (даже если на самом деле это означает лежащий бэкенд, о чём пользователь не догадывается). после этого пользователь идёт в другую ПС, находит там что нужно и фиксирует, что ПС1 ничего не нашла, в то время как ПС2 нашла => ПС2 лучше ПС1. всего пара таких примеров и пользователь будет начинать сразу с ПС2, минуя ПС1. в общем, я не думаю что двухчасовое падение отобьёт у яндекса сколь-нибудь значительное число пользователей.