live · автоматическая лента AI News Watcher
AI/News
// автоматический мониторинг AI-индустрии
@agentic_ai_news

Новости AI-стека

Daily · свежие материалы

хронологический список
10 ИЮН
Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин
09 ИЮН
Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин
08 ИЮН
Daily · Alibaba · Alibaba · TG #465

Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле

Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.

2 мин
03 ИЮН
Daily · Alibaba · Alibaba

Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди

100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.

2 мин
02 ИЮН
Daily · Together AI · Together AI

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

Together AI раскрыла инженерные решения, позволившие обслуживать MiniMax M3 (1M токенов, нативная мультимодальность, MSA-архитектура) с приростом throughput 81–125% на разных уровнях конкурентности. Это первый публичный…

2 мин
01 ИЮН
Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин
01 ИЮН
Daily · Alibaba · Alibaba

Quick BI против галлюцинирующих агентов: почему данные важнее модели

На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…

2 мин
29 МАЯ
Daily · Together AI · Together AI

Together AI: как построить рекордно быстрый Speech-to-Text стек

Together AI представила детальное техническое описание оптимизации всего стека преобразования речи в текст, включая GPU, CPU, память и сетевые протоколы, установив новый мировой рекорд скорости.

8 мин
29 МАЯ
Daily · Alibaba · Alibaba · TG #331

Qwen-VLA: От осмысления к активному вмешательству в реальный мир

Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.

10 мин
28 МАЯ
Daily · Google · Google

Gemini Image Models: видео в картинку, но не для всех

Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.

7 мин
28 МАЯ
Daily · Alibaba · Alibaba

qwen-cloud: облако, где агенты говорят на одном языке

Alibaba Cloud представила Qwen Cloud 26 мая в Сингапуре, создав AI-нативную платформу для работы с агентами и мультимодальными моделями.

10 мин
27 МАЯ
Daily · Alibaba · Alibaba

Alibaba Cloud: комплексная экосистема для агентного ИИ и глобального масштаба

На первой международной конференции Qwen в Сингапуре Alibaba Cloud представила новые модели, инфраструктуру и инструменты для построения и управления ИИ-агентами.

9 мин
26 МАЯ
Daily · Google · Google

Vertex AI Extensions уходят: Google переводит фокус на Agent Platform

Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.

7 мин
25 МАЯ
Daily · Alibaba · Alibaba

qwen3: гибридные рассуждения и сотни миллионов загрузок

Alibaba представила Qwen3 — новое поколение своих открытых больших языковых моделей, вводя гибридные режимы рассуждений и расширяя возможности агентов и многоязычной поддержки.

7 мин
22 МАЯ
Daily · Alibaba · Alibaba

qwen3.5-livetranslate-Flash: Переводит речь, видит контекст, клонирует голос

Alibaba выпустила qwen3.5-livetranslate-Flash, новейшую модель синхронного перевода, которая не просто слушает и переводит речь, но и понимает визуальный контекст. Эта многомодальная система, построенная на архитектуре…

4 мин
21 МАЯ
Daily · Google · Google

Google DeepMind Accelerator: AI против климатических рисков в АТР

Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…

2 мин
19 МАЯ
Daily · Alibaba · Alibaba

Qwen3.7-Max: Модель для агентов и перевод, который видит

Alibaba представила две новые модели: Qwen3.7-Max, ориентированную на автономных агентов, и Qwen3.5-LiveTranslate-Flash, способную к синхронному переводу с учетом визуального контекста. Это развитие AI-возможностей…

3 мин
15 МАЯ
Daily · Together AI · Together AI

Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI

Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…

3 мин
14 МАЯ
Daily · Together AI · Together AI

violin: Открытый AI-перевод видео, который уважает голоса

Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…

3 мин
12 МАЯ
Daily · Together AI · Together AI

Voice Finder от Together AI: 600 голосов теперь можно искать по запросу

Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…

10 мин
06 МАЯ
Daily · Perplexity · Perplexity

Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные

Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…

1 мин
06 МАЯ
Daily · Google · Google

Gemini Interactions API ломается второй раз за полгода — и снова срочно

Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …

3 мин
27 АПР
Daily · Perplexity · Perplexity

Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models

Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…

2 мин
22 АПР
Daily · Google · Google

Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM

Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…

3 мин
21 АПР
Daily · Alibaba · Alibaba

Qwen3.6-27B: Мультимодальный агент с «памятью» мышления и контекстом до миллиона токенов

Alibaba представила новую модель Qwen3.6-27B, позиционируя её как решение для инженерных задач, требующих глубокого понимания кода и сохранения контекста рассуждений. Эта версия, доступная на Hugging Face, включает…

3 мин
15 АПР
Daily · Google · Google

Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос

Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…

2 мин
14 АПР
Daily · Google · Google

Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы

Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…

2 мин
13 АПР
Daily · Perplexity · Perplexity

Agent API Perplexity: новые модели и прощание со старыми Gemini

Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…

2 мин
02 АПР
Daily · Google · Google

Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5

Google выпустил Gemma 4 — открытые модели под Apache 2.0: 3-е и 6-е места среди всех open-моделей мира, обходят те, что в 20 раз крупнее, запускаются хоть на телефоне, хоть на одной видеокарте. А в том же окне тихо…

4 мин
25 МАР
Daily · Google · Google

Lyria 3 Pro: песня целиком — но имитировать артиста модель отказывается

Google выпустил Lyria 3 Pro — модель генерации музыки: уже не 30-секундная петля, а трек до трёх минут с заданной структурой (интро/куплет/припев/бридж по запросу). Но Google намеренно сделал так, что имитировать…

3 мин