AI/News — anthropic ecosystem newsroom

Daily · свежие материалы

хронологический список

Voice Finder от Together AI: 600 голосов теперь можно искать по запросу

Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…

10 мин

06 МАЯ

Daily · Google · Google

Gemini Interactions API ломается второй раз за полгода — и снова срочно

Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …

3 мин

29 АПР

Daily · Deepgram · Deepgram

Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности

Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…

6 мин

22 АПР

Daily · Google · Google

Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM

Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…

3 мин

21 АПР

Daily · Replicate · Replicate

Agent skills для Replicate: учим ассистентов работать с моделями как про

Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…

2 мин

15 АПР

Daily · Replicate · Replicate

Разработчики предлагают несколько советов для получения наилучшего результата:

Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…

4 мин

15 АПР

Daily · Google · Google

Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос

Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…

2 мин

14 АПР

Daily · Google · Google

Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы

Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…

2 мин

08 АПР

Daily · Meta AI · Meta AI

Muse Spark: Meta AI ставит на мультимодальность и параллельное мышление для «персонального сверхинтеллекта»

Meta AI представила muse-spark, первую модель нового семейства Muse, разработанного Meta Superintelligence Labs. Ключевая особенность — нативная мультимодальность и режим contemplating-mode, который позволяет модели…

4 мин

02 АПР

Daily · Google · Google

Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5

Google выпустил Gemma 4 — открытые модели под Apache 2.0: 3-е и 6-е места среди всех open-моделей мира, обходят те, что в 20 раз крупнее, запускаются хоть на телефоне, хоть на одной видеокарте. А в том же окне тихо…

4 мин

27 МАР

Daily · Meta AI · Meta AI

SAM 3.1: Видео, 3D, и открытый мир — Meta AI ускоряет восприятие

Meta AI представила sam-3-1, обновленную модель Segment Anything Model, которая меняет подход к обработке видео. Главное нововведение — мультиплексирование объектов, позволяющее отслеживать до 16 целей за один проход и…

5 мин

25 МАР

Daily · Google · Google

Lyria 3 Pro: песня целиком — но имитировать артиста модель отказывается

Google выпустил Lyria 3 Pro — модель генерации музыки: уже не 30-секундная петля, а трек до трёх минут с заданной структурой (интро/куплет/припев/бридж по запросу). Но Google намеренно сделал так, что имитировать…

3 мин

02 МАР

Daily · Replicate · Replicate

Nano Banana Pro: обходит лимиты Google с резервной моделью

Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…

2 мин

Новости AI-стека

Daily · свежие материалы

Voice Finder от Together AI: 600 голосов теперь можно искать по запросу

Gemini Interactions API ломается второй раз за полгода — и снова срочно

Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности

Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM

Agent skills для Replicate: учим ассистентов работать с моделями как про

**Разработчики предлагают несколько советов для получения наилучшего результата:**

Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос

Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы

Muse Spark: Meta AI ставит на мультимодальность и параллельное мышление для «персонального сверхинтеллекта»

Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5

SAM 3.1: Видео, 3D, и открытый мир — Meta AI ускоряет восприятие

Lyria 3 Pro: песня целиком — но имитировать артиста модель отказывается

Nano Banana Pro: обходит лимиты Google с резервной моделью

Замечания по сайту

Разработчики предлагают несколько советов для получения наилучшего результата: