Технический сбой на серверах Cloudflare днем во вторник, 18 ноября, стал причиной сбоев в работе интернета по всему миру и в Израиле. Часть сайтов уже вернулись к нормальной работе, другие - например, ChatGPT - все еще нет.
Первые сообщения о проблеме поступили около 12:30, и через 15 минут компания опубликовала обновление, в котором признала наличие проблемы. Тем временем акции компании упали на 4,1% на предпродажных торгах.
Cloudflare - глобальная компания, занимающаяся интернет-инфраструктурой, которая предоставляет различные услуги, направленные на повышение безопасности, производительности и надежности многих веб-сайтов и онлайн-сервисов, лежащих в основе современного интернета. Среди прочего, это инструменты для защиты веб-сайтов от кибератак.
Пользователи социальной сети X (бывшая Twitter), сайта ChatGPT, сервиса Spotify и сайта с обзорами фильмов Letterboxd сообщили, что внутренняя ошибка сервера в сети Cloudflare приводит к тому, что страница не отображается. Пользователям предлагается "повторить попытку через несколько минут".
Компания опубликовала на своем сайте ответ, заявив, что "она знает о проблеме, которая может затронуть некоторых клиентов, и расследует ее, более подробная информация будет предоставлена по мере поступления".
Позже компания предоставила краткую техническую информацию о характере проблем и пообещала: "Мы работаем над тем, чтобы понять все последствия и разрешить проблему. Дополнительные обновления появятся в ближайшее время". В последнем послании компания сообщает о "восстановлении сервиса, но клиенты могут по-прежнему сталкиваться с более высоким, чем обычно, количеством ошибок, поскольку мы продолжаем ремонтные работы".
Сайт мониторинга Down Detector, отслеживающий сбои в работе сети, сам в последние часы частично вышел из строя, но после его перезагрузки наблюдался резкий всплеск сбоев по всему миру. В последние минуты некоторые сайты, похоже, восстановили работу, но компания пока не сообщила на своей странице статуса, что проблема устранена.
Всего месяц назад аналогичный технический сбой произошел в AWS (облачном сервисе Amazon), вызвав масштабный сбой в работе веб-сайтов.
Это не первый случай, когда сбой в работе Cloudflare вывел из строя множество веб-сайтов. 12 сентября по всему миру появились сообщения о сбоях в работе продуктов компании. Сбой длился более часа и был вызван ошибкой, которая привела к "отправке ненужных и беспрерывных запросов в систему".
В июле 2020 года опечатка, допущенная инженером компании при обновлении настроек маршрутизатора (роутера) в серверном центре в Атланте, привела к еще одному сбою. Вместо того чтобы распределить трафик во внутренней сети компании для снижения нагрузки на маршрутизатор, весь трафик с маршрутизаторов компании из разных точек мира был перенаправлен на него. Генеральный директор компании Мэтью Принс тогда пояснил, что инженер не будет уволен, поскольку он, генеральный директор, берет на себя ответственность за то, что персоналу компании не было поручено создавать механизмы, способные выдерживать такую нагрузку.


