AI/News — anthropic ecosystem newsroom

Daily · свежие материалы

хронологический список

Daily · OpenRouter · OpenRouter · TG #506

Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление

На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.

1 мин

10 ИЮН

Daily · Deepgram · Deepgram · TG #492

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.

1 мин

10 ИЮН

Daily · OpenRouter · OpenRouter · TG #490

OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла

Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.

2 мин

10 ИЮН

Daily · Google · Google · TG #489

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.

2 мин

09 ИЮН

Daily · OpenRouter · OpenRouter · TG #481

Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем

$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.

1 мин

09 ИЮН

Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин

08 ИЮН

Daily · OpenRouter · OpenRouter · TG #468

Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench

Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.

1 мин

02 ИЮН

Daily · OpenRouter · OpenRouter

На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft

Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.

1 мин

02 ИЮН

Daily · Together AI · Together AI

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

Together AI раскрыла инженерные решения, позволившие обслуживать MiniMax M3 (1M токенов, нативная мультимодальность, MSA-архитектура) с приростом throughput 81–125% на разных уровнях конкурентности. Это первый публичный…

2 мин

01 ИЮН

Daily · OpenRouter · OpenRouter

OpenRouter: 100 триллионов токенов, $113M и пять новых enterprise-функций за май

OpenRouter закрыл Series B на $113M и достиг 100 трлн токенов в месяц — на этом фоне майский релиз показывает, куда идут деньги: в enterprise-контроль, мультимодельный ансамбль и голосовые API поверх единого ключа…

1 мин

01 ИЮН

Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

1 мин

31 МАЯ

Daily · OpenRouter · OpenRouter

OpenRouter задокументировал Fusion Router: что внутри пайплайна panel → judge → synthesis

OpenRouter впервые опубликовал полную документацию Fusion Router — с описанием конфигурации, схемой трёхэтапного конвейера и поведением при сбоях. До этого фича существовала без внятного описания; теперь её можно…

1 мин

29 МАЯ

Daily · Together AI · Together AI

Together AI: как построить рекордно быстрый Speech-to-Text стек

Together AI представила детальное техническое описание оптимизации всего стека преобразования речи в текст, включая GPU, CPU, память и сетевые протоколы, установив новый мировой рекорд скорости.

8 мин

29 МАЯ

Daily · OpenRouter · OpenRouter

Guardrails от OpenRouter: Как защитить агентов, данные и бюджет от произвола LLM

OpenRouter представил функцию Guardrails, предлагающую набор настраиваемых инструментов для контроля безопасности, приватности и расходов LLM-приложений.

7 мин

29 МАЯ

Daily · Deepgram · Deepgram

Nova-3 Medical: точность в медицине растет, но что с остальным?

Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.

6 мин

28 МАЯ

Daily · OpenRouter · OpenRouter

Фильтрация IP-адресов для корпоративных планов OpenRouter

OpenRouter добавила возможность ограничить использование API-ключей утвержденными IP-диапазонами, повышая безопасность для организаций.

6 мин

28 МАЯ

Daily · Deepgram · Deepgram · TG #336

Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским

Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.

6 мин

28 МАЯ

Daily · Google · Google

Gemini Image Models: видео в картинку, но не для всех

Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.

7 мин

27 МАЯ

Daily · OpenRouter · OpenRouter

OpenRouter: Claude Opus 4.8 уже здесь, а платформа получила $113M и новый API

Платформа OpenRouter значительно расширила свои предложения, добавив модели Claude Opus 4.8 и Opus 4.8 Fast, а также привлекла $113 млн в рамках раунда финансирования Серии B.

7 мин

27 МАЯ

Daily · Deepgram · Deepgram

Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать

Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.

6 мин

26 МАЯ

Daily · OpenRouter · OpenRouter

OpenRouter: детализация моделей, умный маршрутизатор и строгие IP-списки

OpenRouter представил обновления, включающие улучшенные инструменты выбора моделей, гибкую автоматическую маршрутизацию с контролем стоимости и усиление безопасности IP-адресов.

6 мин

26 МАЯ

Daily · Google · Google

Vertex AI Extensions уходят: Google переводит фокус на Agent Platform

Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.

7 мин

25 МАЯ

Daily · OpenRouter · OpenRouter

OpenRouter: логи, ключи API и видеоошибки теперь в одном клике

Обновления от 25 мая 2026 года упрощают навигацию по логам, доступ к деталям API-ключей и диагностику ошибок видеогенерации.

5 мин

21 МАЯ

Daily · OpenRouter · OpenRouter

Qwen3.7 Max: миллион токенов на OpenRouter и новый взгляд на API-ключи

OpenRouter обновил свою платформу, добавив поддержку модели Qwen3.7 Max от Qwen, известной своим большим контекстным окном. Одновременно с этим, пользователи получили расширенные возможности по управлению историей чатов…

2 мин

21 МАЯ

Daily · Google · Google

Google DeepMind Accelerator: AI против климатических рисков в АТР

Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…

2 мин

19 МАЯ

Daily · Deepgram · Deepgram

Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать

Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…

1 мин

15 МАЯ

Daily · Together AI · Together AI

Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI

Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…

3 мин

14 МАЯ

Daily · Together AI · Together AI

violin: Открытый AI-перевод видео, который уважает голоса

Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…

3 мин

14 МАЯ

Daily · Deepgram · Deepgram

Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках

Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…

4 мин

12 МАЯ

Daily · Together AI · Together AI

Voice Finder от Together AI: 600 голосов теперь можно искать по запросу

Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…

10 мин

Новости AI-стека

Daily · свежие материалы

Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление

Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте

OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла

DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии

Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench

На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft

Как Together AI запустила 1M-контекст MiniMax M3 в продакшне без деградации throughput

OpenRouter: 100 триллионов токенов, $113M и пять новых enterprise-функций за май

Gemini 2.0 Flash отключён — что ставить вместо него

OpenRouter задокументировал Fusion Router: что внутри пайплайна panel → judge → synthesis

Together AI: как построить рекордно быстрый Speech-to-Text стек

Guardrails от OpenRouter: Как защитить агентов, данные и бюджет от произвола LLM

Nova-3 Medical: точность в медицине растет, но что с остальным?

Фильтрация IP-адресов для корпоративных планов OpenRouter

Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским

Gemini Image Models: видео в картинку, но не для всех

OpenRouter: Claude Opus 4.8 уже здесь, а платформа получила $113M и новый API

Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать

OpenRouter: детализация моделей, умный маршрутизатор и строгие IP-списки

Vertex AI Extensions уходят: Google переводит фокус на Agent Platform

OpenRouter: логи, ключи API и видеоошибки теперь в одном клике

Qwen3.7 Max: миллион токенов на OpenRouter и новый взгляд на API-ключи

Google DeepMind Accelerator: AI против климатических рисков в АТР

Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать

Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI

violin: Открытый AI-перевод видео, который уважает голоса

Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках

Voice Finder от Together AI: 600 голосов теперь можно искать по запросу

Замечания по сайту