live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
10 ИЮН
Daily · Deepgram · Deepgram · TG #492

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.

1 мин
10 ИЮН
Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин
09 ИЮН
Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин
08 ИЮН
Daily · Alibaba · Alibaba · TG #465

Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле

Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.

2 мин
04 ИЮН
Daily · Tencent · Tencent Hunyuan · TG #450

Sculpt4D от Tencent ARC генерирует 4D-объекты из видео — на 56% дешевле полного внимания

Модель надстроена над Hunyuan3D 2.1 и уже открыта на Hugging Face — но время инференса и лицензия не раскрыты.

1 мин
04 ИЮН
Daily · Black Forest Labs · Black Forest Labs · TG #446

FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки

Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.

1 мин
03 ИЮН
Daily · Replicate · Replicate · TG #440

Replicate устранил очереди и задержки на кластерах L40S и H200

Конкуренция за модели замедляла запуски — теперь система работает штатно.

1 мин
03 ИЮН
Daily · Cerebras · Cerebras · TG #435

Cerebras Inference лёг из-за сбоя биллинга AWS

Проблема была не в чипах — в платёжной интеграции с Amazon.

1 мин
03 ИЮН
Daily · Alibaba · Alibaba

Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди

100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.

2 мин
02 ИЮН
Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

1 мин
01 ИЮН
Daily · Cerebras · Cerebras

StepFun Step 3.5/3.7 Flash появились на выделенных эндпоинтах Cerebras

Cerebras открыл dedicated endpoints для Step 3.5 Flash и Step 3.7 Flash от StepFun. Enterprise-клиенты получают изолированную инфраструктуру под MoE-модели — и это не просто удобство, а принципиальный сдвиг для…

1 мин
01 ИЮН
Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин
01 ИЮН
Daily · Alibaba · Alibaba

Quick BI против галлюцинирующих агентов: почему данные важнее модели

На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…

2 мин
30 МАЯ
Daily · Recraft · Recraft

Recraft V4.1 Utility Pro стал самым высокорейтинговым моделью text-to-image за пределами Google и OpenAI

Recraft V4.1 Utility Pro заняла третье место в глобальном рейтинге Artificial Analysis Image Arena, став самой высокорейтинговой моделью text-to-image от независимой лаборатории.

5 мин
29 МАЯ
Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин
29 МАЯ
Daily · Deepgram · Deepgram

Nova-3 Medical: точность в медицине растет, но что с остальным?

Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.

6 мин
29 МАЯ
Daily · Alibaba · Alibaba · TG #331

Qwen-VLA: От осмысления к активному вмешательству в реальный мир

Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.

10 мин
28 МАЯ
Daily · Replicate · Replicate

Снижение производительности flux-2-klein-4b

Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.

1 мин
28 МАЯ
Daily · Black Forest Labs · Black Forest Labs

FLUX VTO: виртуальная примерка в масштабе каталога

Black Forest Labs анонсировала FLUX VTO — новую технологию виртуальной примерки одежды, предназначенную для ритейлеров, которая обеспечивает высокую скорость, точность рендеринга и гибкость стилизации для больших…

7 мин
28 МАЯ
Daily · Deepgram · Deepgram · TG #336

Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским

Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.

6 мин
28 МАЯ
Daily · Google · Google

Gemini Image Models: видео в картинку, но не для всех

Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.

7 мин
28 МАЯ
Daily · Alibaba · Alibaba

qwen-cloud: облако, где агенты говорят на одном языке

Alibaba Cloud представила Qwen Cloud 26 мая в Сингапуре, создав AI-нативную платформу для работы с агентами и мультимодальными моделями.

10 мин
27 МАЯ
Daily · Deepgram · Deepgram

Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать

Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.

6 мин
27 МАЯ
Daily · Cerebras · Cerebras

Cerebras: две модели уходят в запас, время миграции

Cerebras прекращает поддержку моделей llama3.1-8b и qwen-3-235b-a22b-instruct-2507 с 27 мая 2026 года, призывая пользователей к переходу на рекомендованные альтернативы.

9 мин
27 МАЯ
Daily · Alibaba · Alibaba

Alibaba Cloud: комплексная экосистема для агентного ИИ и глобального масштаба

На первой международной конференции Qwen в Сингапуре Alibaba Cloud представила новые модели, инфраструктуру и инструменты для построения и управления ИИ-агентами.

9 мин
26 МАЯ
Daily · Google · Google

Vertex AI Extensions уходят: Google переводит фокус на Agent Platform

Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.

7 мин
26 МАЯ
Daily · Cerebras · Cerebras

Cerebras: суверенитет в ИИ — как его видит производитель вафельных чипов

Cerebras запускает глобальную инициативу “Cerebras for Nations” для поддержки стран в развитии собственного ИИ, обеспечивая контроль над инфраструктурой, моделями и данными.

11 мин
25 МАЯ
Daily · Alibaba · Alibaba

qwen3: гибридные рассуждения и сотни миллионов загрузок

Alibaba представила Qwen3 — новое поколение своих открытых больших языковых моделей, вводя гибридные режимы рассуждений и расширяя возможности агентов и многоязычной поддержки.

7 мин
22 МАЯ
Daily · DeepSeek · X · DeepSeek

DeepSeek-V4-Pro: дисконт, ставший бессрочным

DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…

1 мин
22 МАЯ
Daily · Alibaba · Alibaba

qwen3.5-livetranslate-Flash: Переводит речь, видит контекст, клонирует голос

Alibaba выпустила qwen3.5-livetranslate-Flash, новейшую модель синхронного перевода, которая не просто слушает и переводит речь, но и понимает визуальный контекст. Эта многомодальная система, построенная на архитектуре…

4 мин