live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
03 ИЮН
Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин
03 ИЮН
Daily · Cerebras · Cerebras · TG #435

Cerebras Inference лёг из-за сбоя биллинга AWS

Проблема была не в чипах — в платёжной интеграции с Amazon.

1 мин
02 ИЮН
Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин
01 ИЮН
Daily · Cerebras · Cerebras

StepFun Step 3.5/3.7 Flash появились на выделенных эндпоинтах Cerebras

Cerebras открыл dedicated endpoints для Step 3.5 Flash и Step 3.7 Flash от StepFun. Enterprise-клиенты получают изолированную инфраструктуру под MoE-модели — и это не просто удобство, а принципиальный сдвиг для…

1 мин
29 МАЯ
Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин
28 МАЯ
Daily · Replicate · Replicate

Снижение производительности flux-2-klein-4b

Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.

1 мин
27 МАЯ
Daily · Cerebras · Cerebras

Cerebras: две модели уходят в запас, время миграции

Cerebras прекращает поддержку моделей llama3.1-8b и qwen-3-235b-a22b-instruct-2507 с 27 мая 2026 года, призывая пользователей к переходу на рекомендованные альтернативы.

9 мин
26 МАЯ
Daily · Cerebras · Cerebras

Cerebras: суверенитет в ИИ — как его видит производитель вафельных чипов

Cerebras запускает глобальную инициативу “Cerebras for Nations” для поддержки стран в развитии собственного ИИ, обеспечивая контроль над инфраструктурой, моделями и данными.

11 мин
01 МАЯ
Daily · Cerebras · Cerebras

Cerebras: инцидент с Qwen-моделью и 5-кратный прирост для coding-агентов Cognition

Cerebras сообщила об устранении инцидента с одной из своих моделей и сделала общедоступной важную функциональность для управления API-ключами. Параллельно компания представила результаты работы с Cognition, где их…

3 мин
27 АПР
Daily · Cerebras · Cerebras

Cerebras: выделенные конечные точки теперь поддерживают GLM 5 и Kimi K2.6

Cerebras добавляет новые модели от Z.AI и Moonshot AI на свои выделенные конечные точки. Этот шаг призван предоставить инженерам больше гибкости и выбора для развертывания специфических языковых моделей…

1 мин
22 АПР
Daily · Cerebras · Cerebras

Cerebras: ключ к кэшу промптов ускорит LLM-инференс, но две модели уйдут в отставку

Cerebras обновила свой API, добавив параметр prompt_cache_key, который позволяет управлять кэшированием промптов и сократить задержку до первого токена. Это небольшое, но важное изменение даёт инженерам больше контроля…

2 мин
21 АПР
Daily · Replicate · Replicate

Agent skills для Replicate: учим ассистентов работать с моделями как про

Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…

2 мин
15 АПР
Daily · Replicate · Replicate

**Разработчики предлагают несколько советов для получения наилучшего результата:**

Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…

4 мин
02 МАР
Daily · Replicate · Replicate

Nano Banana Pro: обходит лимиты Google с резервной моделью

Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…

2 мин