live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
11 ИЮН
Daily · xAI · xAI (Grok) · TG #502

Grok Build получил встроенный магазин плагинов — MongoDB, Sentry и Vercel с одной команды

Каждый плагин закреплён за конкретным коммитом SHA — xAI верифицирует его при установке.

1 мин
10 ИЮН
Daily · xAI · xAI (Grok) · TG #494

Инвестиционный агент Tori от eToro теперь читает настроения рынка прямо из X

Тот же поток данных xAI открыл через API — любая команда может подключиться за несколько минут.

1 мин
10 ИЮН
Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин
09 ИЮН
Daily · xAI · xAI (Grok) · TG #482

Grok теперь собирает корзину в Gopuff до того, как вы открыли приложение

xAI тянет сигналы из X и данные о погоде, чтобы предугадывать заказы — первый публичный кейс Grok-агента в ритейле.

1 мин
09 ИЮН
Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин
03 ИЮН
Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин
03 ИЮН
Daily · Cerebras · Cerebras · TG #435

Cerebras Inference лёг из-за сбоя биллинга AWS

Проблема была не в чипах — в платёжной интеграции с Amazon.

1 мин
02 ИЮН
Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин
01 ИЮН
Daily · Cerebras · Cerebras

StepFun Step 3.5/3.7 Flash появились на выделенных эндпоинтах Cerebras

Cerebras открыл dedicated endpoints для Step 3.5 Flash и Step 3.7 Flash от StepFun. Enterprise-клиенты получают изолированную инфраструктуру под MoE-модели — и это не просто удобство, а принципиальный сдвиг для…

1 мин
01 ИЮН
Daily · xAI · xAI (Grok)

Composer 2.5 внутри Grok Build: файн-тюн Kimi K2.5 с 25× больше синтетики

xAI выпустила Composer 2.5 — агентную кодинговую модель на базе open-source чекпоинта Moonshot Kimi K2.5, обученную на синтетических задачах в 25 раз интенсивнее предшественника. Интересно тут не сам релиз, а…

1 мин
01 ИЮН
Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин
29 МАЯ
Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин
28 МАЯ
Daily · Replicate · Replicate

Снижение производительности flux-2-klein-4b

Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.

1 мин
28 МАЯ
Daily · Google · Google

Gemini Image Models: видео в картинку, но не для всех

Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.

7 мин
27 МАЯ
Daily · Cerebras · Cerebras

Cerebras: две модели уходят в запас, время миграции

Cerebras прекращает поддержку моделей llama3.1-8b и qwen-3-235b-a22b-instruct-2507 с 27 мая 2026 года, призывая пользователей к переходу на рекомендованные альтернативы.

9 мин
27 МАЯ
Daily · xAI · xAI (Grok)

Grok в Kilo Code: подписка вместо API-ключа для агентного кодинга

xAI представила прямую подписочную интеграцию моделей Grok, включая Grok Build, в платформу Kilo Code для пользователей X Premium+ и SuperGrok, устраняя необходимость в API-ключах.

7 мин
26 МАЯ
Daily · Google · Google

Vertex AI Extensions уходят: Google переводит фокус на Agent Platform

Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.

7 мин
26 МАЯ
Daily · Cerebras · Cerebras

Cerebras: суверенитет в ИИ — как его видит производитель вафельных чипов

Cerebras запускает глобальную инициативу “Cerebras for Nations” для поддержки стран в развитии собственного ИИ, обеспечивая контроль над инфраструктурой, моделями и данными.

11 мин
25 МАЯ
Daily · xAI · xAI (Grok)

Grok Build: агент для кода прямо в терминале

xAI представила раннюю бета-версию Grok Build — мощного агента для кодирования в командной строке, доступного подписчикам SuperGrok и X Premium Plus.

5 мин
22 МАЯ
Daily · xAI · xAI (Grok)

Grok: не только в браузере — теперь через OpenClaw

xAI запустила интеграцию Grok с OpenClaw, позволяя пользователям с подписками SuperGrok или X Premium запускать модели Grok внутри этого open-source локального агента. Этот шаг переносит возможности Grok из облака на…

2 мин
21 МАЯ
Daily · Google · Google

Google DeepMind Accelerator: AI против климатических рисков в АТР

Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…

2 мин
06 МАЯ
Daily · Perplexity · Perplexity

Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные

Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…

1 мин
06 МАЯ
Daily · Google · Google

Gemini Interactions API ломается второй раз за полгода — и снова срочно

Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …

3 мин
01 МАЯ
Daily · Cerebras · Cerebras

Cerebras: инцидент с Qwen-моделью и 5-кратный прирост для coding-агентов Cognition

Cerebras сообщила об устранении инцидента с одной из своих моделей и сделала общедоступной важную функциональность для управления API-ключами. Параллельно компания представила результаты работы с Cognition, где их…

3 мин
27 АПР
Daily · Perplexity · Perplexity

Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models

Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…

2 мин
27 АПР
Daily · Cerebras · Cerebras

Cerebras: выделенные конечные точки теперь поддерживают GLM 5 и Kimi K2.6

Cerebras добавляет новые модели от Z.AI и Moonshot AI на свои выделенные конечные точки. Этот шаг призван предоставить инженерам больше гибкости и выбора для развертывания специфических языковых моделей…

1 мин
23 АПР
Daily · xAI · xAI (Grok)

Grok Voice Think Fast 1.0: Не просто слушает, но и думает без пауз

xAI представила свою новую флагманскую голосовую модель Grok Voice Think Fast 1.0, разработанную для сложных и многоэтапных диалогов. Эта модель позиционируется как ключевой инструмент для автоматизации клиентской…

4 мин
22 АПР
Daily · Cerebras · Cerebras

Cerebras: ключ к кэшу промптов ускорит LLM-инференс, но две модели уйдут в отставку

Cerebras обновила свой API, добавив параметр prompt_cache_key, который позволяет управлять кэшированием промптов и сократить задержку до первого токена. Это небольшое, но важное изменение даёт инженерам больше контроля…

2 мин
22 АПР
Daily · Google · Google

Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM

Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…

3 мин
21 АПР
Daily · Replicate · Replicate

Agent skills для Replicate: учим ассистентов работать с моделями как про

Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…

2 мин