Новости AI-стека
Daily · свежие материалы
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Сообщение от Ивана Чжана (сооснователя и технического директора Cohere)
Неофициальный пост в X (ранее Twitter) от сооснователя и технического директора Cohere Ивана Чжана, содержащий краткое личное сообщение.
Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским
Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.
Gemini Image Models: видео в картинку, но не для всех
Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.
Cohere: «Языковое замешательство» скрывает пробелы в безопасности многоязычных моделей
Новое исследование Cohere Labs выявило, что бинарные системы оценки безопасности не способны адекватно реагировать на «языковое замешательство» в многоязычных ИИ-моделях, делая их ложно безопасными.
Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать
Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.
Runway Seedance: инцидент с генерациями быстро устранен
На платформе Runway 27 мая 2026 года произошел кратковременный инцидент с генерациями Seedance, который был устранен за 33 минуты.
Cohere: Зачем CEO едет в Хайльбронн, чтобы обсудить «суверенный AI»?
Генеральный директор Cohere Эйдан Гомес примет участие в европейской конференции, подчеркивая глобальные амбиции компании в области суверенного ИИ и безопасной реализации корпоративных решений.
Vertex AI Extensions уходят: Google переводит фокус на Agent Platform
Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.
Project Luxo: AI-видео перестает быть демонстрацией технологий и начинает рассказывать истории
Runway ML утверждает, что модель Aleph 2.0 позволила AI-генерированному видео преодолеть "зловещую долину" и фокусироваться на эмоциональном повествовании.
Cohere Labs: «Эмоциональные» отчёты меняют координацию ИИ-агентов
Компания продемонстрировала новые подходы к координации ИИ-агентов и активно интегрировалась в технологическое сообщество Торонто.
Runway: Сбои в генерации GPT Image 2 устранены, но Veo 3.1 пока нестабилен
Платформа Runway оперативно решила проблемы с генерацией изображений GPT Image 2, однако сбои в работе Veo 3.1 также были зафиксированы и устранены.
Cohere: когда CEO и CTO приглашают на вечеринку вместо запуска моделей
Cohere, известный своими языковыми моделями, на этой неделе привлек внимание не анонсами новых моделей или API, а активным участием своих сооснователей в мероприятиях Toronto Tech Week. CEO Айдан Гомес и CTO Иван Чжан…
Google DeepMind Accelerator: AI против климатических рисков в АТР
Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…
Command A+: модель Cohere «похудела» почти без потерь производительности
Cohere активно развивает как производственные аспекты своих моделей, так и исследовательское направление. На этой неделе модель Command A+ стала доступна на Hugging Face с оптимизированным квантованием W4A4, что…
Command A+: Cohere выпускает открытую модель, работающую на скромном железе
Cohere представила Command A+, свою самую новую большую языковую модель. Интерес здесь не только в её возможностях, но и в том, как Cohere позиционирует модель для развёртывания: она оптимизирована для работы на…
Command A+: агенты стали умнее, модель заговорила на 48 языках
Cohere выпустила Command A+, новую модель, которая меняет подход к созданию умных агентов. Теперь они не только лучше понимают контекст, но и могут работать с изображениями и общаться на десятках языков, предлагая…
Gemini 3.1 Flash Lite: Deepgram обновляет Voice Agent API — пора мигрировать
Deepgram объявил о доступности Gemini 3.1 Flash Lite в своём Voice Agent API, который теперь полностью управляем Google. Это означает, что предварительная версия модели устаревает, и всем пользователям предстоит…
Cohere: покупка Reliant AI и фокус на фармацевтике
Компания Cohere сделала ставку на корпоративный ИИ в медицине, приобретя Reliant AI — фирму, специализирующуюся на суверенных решениях для здравоохранения и биофармацевтики. Этот шаг стратегически совпадает с…
Глава Cohere назвал Торонто центром вселенной
В мире, где Кремниевая долина и крупные технологические хабы часто заявляют о своем превосходстве, один из лидеров AI-индустрии высказал неожиданное мнение. Эйдан Гомес, сооснователь и CEO Cohere, предложил взглянуть на…
Сооснователь Cohere: «i am ice man» – о чем это?
Иван Чжан, соучредитель и технический директор компании Cohere, опубликовал на своей странице в X короткое, но крайне лаконичное личное сообщение. Этот пост, состоящий всего из нескольких фраз, вызвал вопросы из-за…
Business AI в WhatsApp: Meta дает ИИ-помощников для малого бизнеса — но пока только в Индии
Meta запустила в Индии функцию Business AI для WhatsApp Business App, предлагая малому бизнесу автоматизированные ответы на запросы клиентов и управление продажами прямо в приложении. Это решение, доступное на всех…
Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках
Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…
Cohere намекает на новую инициативу «Project Pursue» и ищет истину в данных
Загадочное сообщение «The truth is out there…» появилось сегодня в аккаунте Cohere на X, сопровождаемое ссылкой на новую страницу «Project Pursue» на их официальном веб-сайте. Деталей инициативы пока нет, но это…
Runway Agent: видео целиком за один диалог
Runway представила Runway Agent, креативного ИИ-партнера, который призван упростить процесс создания готового к публикации видеоконтента. От первоначальной идеи до финального ролика с несколькими сценами, озвучкой и…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
Gemini 3 Pro Image: когда промпт — это полотно, а референсов полдюжины
Runway выпустил новую модель для генерации изображений — Gemini 3 Pro Image. Она же Nano Banana Pro, или gemini_image3_pro в API. Модель заточена под детализированные текстовые запросы и множество референсных…