Компания, которая продаёт скорость инференса как главное преимущество перед GPU-облаками, остановилась не из-за своего железа. 3 июня клиенты Cerebras с биллингом через AWS потеряли доступ к сервису — причиной стал сбой в платёжной интеграции с Amazon.
Сбой был частичным: проблемы с доступностью испытывали только те пользователи, которые платят через AWS billing. Остальные клиенты, судя по всему, работали штатно.
Здесь есть структурный момент. Cerebras строит собственный wafer-scale стек — процессоры размером с пластину кремния, заточенные под быстрый инференс. Но для монетизации компания использует стандартную облачную биллинговую инфраструктуру AWS. Именно этот слой — чужой и стандартный — стал точкой отказа.
Сбой небольшой, но показательный: скорость инференса не защищает от падений в биллинговом слое, который отдан на аутсорс. Cerebras не раскрыла, сколько клиентов пострадало, как долго длился инцидент и есть ли планы снизить зависимость от AWS billing.