AI News Watcher
Monday, Jun 1, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 01, 2026 · 1 min read · Cerebras ← Back to feed

StepFun Step 3.5/3.7 Flash появились на выделенных эндпоинтах Cerebras daily

Sparse MoE с 196B параметрами и ~11B активными — теперь с гарантированной пропускной способностью.

Hero illustration: StepFun Step 3.5/3.7 Flash появились на выделенных эндпоинтах Cerebras.

Редакция · Daily briefing

Cerebras открыл dedicated endpoints для Step 3.5 Flash и Step 3.7 Flash от StepFun. Enterprise-клиенты получают изолированную инфраструктуру под MoE-модели — и это не просто удобство, а принципиальный сдвиг для production-нагрузок, где деградация латентности от соседних воркloadов неприемлема.

На shared-инференсе пропускная способность и задержка зависят от того, что делают другие пользователи в тот же момент. Dedicated Endpoints убирают эту переменную: зарезервированная мощность работает только на одну организацию, throughput и латентность предсказуемы под нагрузкой. Для real-time приложений и customer-facing продуктов это меняет расчёт надёжности.

Step 3.5 Flash — sparse MoE: при 196.81B суммарных параметрах на каждый токен активируется только ~11B. Из этого вытекает несколько практических характеристик:

Про Step 3.7 Flash Cerebras пока не раскрыл публичных характеристик.

Логика пары «sparse MoE + выделенное железо» прямая: активный compute дешевле, чем у dense-моделей сопоставимого качества, а зарезервированная мощность убирает джиттер латентности. Но Cerebras не опубликовал ни тарифы dedicated-тарифов для Step-моделей, ни измеренные показатели throughput именно на своём железе. Цифры 100–350 tok/s — из карточки NVIDIA Build, не из Cerebras. Сравнивать пока не с чем.

Основная статья

  1. New dedicated models: StepFun Step 3.5 Flash and Step 3.7 Flash

Дополнительные источники

  1. https://inference-docs.cerebras.ai/dedicated/overview#supported-models
  2. https://platform.stepfun.ai/docs/en/guides/models/step-3.5-flash
  3. https://platform.stepfun.ai/docs/en/guides/models/step-3.7-flash
  4. aboutamazon.com
  5. amazon.com
  6. ycombinator.com