Меню
  • Главная
  • О компании
  • Услуги
  • Контакты
Rus Eng
+7 (495) 697-64-49
Rus Eng
logo
Подписаться
24.08.2011

«Яндекс» раскрыл причины многочасовой аварии

Многочасовой сбой в работе «Яндекса» был вызван ошибкой ПО на маршрутизаторе в новом дата-центре в Амстердаме.
Около 22 часов 19 августа 2011 г. сервисы «Яндекса» начали восстанавливать работу после серьезного сбоя, произошедшего пятью часами ранее.
Замруководителя департамента эксплуатации «Яндекс» Владимир Иванов вечером 19 августа разместил в своем блоге постинг, в котором объяснил причины аварии и сообщил, что к моменту публикации основные последствия проблемы были устранены.
Согласно его записи, она произошла из-за «проблем с маршрутизацией в сети Яндекса». Он подчеркнул, что сбой не был связан «с работой дата-центров, DDoS-атаками, пожарами, а также любыми другими внешними факторами». Никакие пользовательские данные не потеряны, подчеркнул он.
Напомним, что начиная с 17 часов 19 августа 2011 г. поисковик «Яндекс» переживал серьезный сбой в работе, выразившийся в прекращении работы всех сервисов «Яндекса», включая поиск. Серверы поисковика были недоступны по команде ping. Тогда же представитель компании Очир Манджиков заявил CNews, что «специалисты компании сейчас ищут причины сбоя», и не высказал в этой связи никаких предположений.
«Подробности для тех, кому интересно» привел в своем постинге Владимир Иванов. По его описанию, «проблема была вызвана ошибкой программного обеспечения на маршрутизаторе, расположенном в нашем новом дата-центре в Амстердаме. В Яндексе используются протоколы маршрутизации – внутренний протокол OSPF и внешний протокол BGP. Из-за ошибки информация обо всех внешних маршрутах оказалась во внутренних таблицах маршрутизации. Это примерно на три порядка больше маршрутов, чем обычно. Протокол OSPF не рассчитан на такое количество. В результате у всех маршрутизаторов кончилась память, и они перестали работать. Нарушилась работа сети, и через несколько минут Яндекс стал полностью недоступен».
Согласно Иванову, внутренняя сеть поисковика тоже не работала, поэтому специалистам «Яндекса» потребовалось много времени, «чтобы по цепочке добраться до источника проблемы».
Когда администраторы исправили ошибку на маршрутизаторе, специалистам пришлось «разделить сеть на несколько частей», чтобы снять лишнюю нагрузку с остальных маршрутизаторов, которых в «Яндексе» больше сотни. Когда количество трафика снизилось, маршрутизаторы смогли самостоятельно восстановить связность сети, и через некоторое время сервисы Яндекса стали доступны большей части пользователей.
Владислав Мещеряков
http://www.cnews.ru/news/top/

Последние новости

  • Минцифры инициирует введение уголовной ответственности за отсутствие IMEI-номеров в договорах с иностранцами
  • Энергия для цифры: Минэнерго РФ синхронизирует стратегию развития ТЭК со строительством дата-центров
  • Объявлены сроки и процедура формирования перечня территорий для совместного использования РЭС
  • Путин подписал закон о совместном использовании телеком-инфраструктуры мобильных операторов в сельских районах и на автодорогах
  • Путин подписал закон о штрафах до 1 млн рублей для операторов связи за нарушение правил идентификации и безопасности
  • Госдума вводит крупные штрафы за нарушения при авторизации и работе алгоритмов
Больше новостей
Закрыть
О компании
Консультационное агентство «Телекомпас» - это более 30 лет эффективной работы в телеком и медиабизнесе, всесторонний подход к решению любого вопроса и оптимальные решения самых сложных задач.
logo
Меню
  • О компании
  • Услуги
  • Контакты
  • Новости отрасли
  • Телеком-словарь
Контакты
+7 (495) 697-64-49
info@telecompass.ru
Москва, Малый Знаменский пер., д.3/5, стр.6
© 2024 ООО «Консультационное агентство «Телекомпас»
ООО Телекомпас

Контактная форма