Новости AI-стека
Daily · свежие материалы
GitHub Copilot: стабильные метрики, новые модели и умный поиск
Разработка с помощью AI становится всё более детализированной, и за кадром постоянно меняется инфраструктура: от того, где хранятся отчеты, до того, какие модели скрываются за привычным чатом. GitHub Copilot продолжает…
Transformers 5.9.0: новые модели и меняющийся интерфейс эмбеддингов
HuggingFace выпустил библиотеку Transformers v5.9.0, добавив три новые модели и внеся важные изменения в обработку текстовых эмбеддингов для ряда моделей компьютерного зрения. Это обновление включает как новые…
Command A+: Cohere выпускает открытую модель, работающую на скромном железе
Cohere представила Command A+, свою самую новую большую языковую модель. Интерес здесь не только в её возможностях, но и в том, как Cohere позиционирует модель для развёртывания: она оптимизирована для работы на…
Command A+: агенты стали умнее, модель заговорила на 48 языках
Cohere выпустила Command A+, новую модель, которая меняет подход к созданию умных агентов. Теперь они не только лучше понимают контекст, но и могут работать с изображениями и общаться на десятках языков, предлагая…
Ettin Reranker: как пересортировать поиск без лишних затрат
Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над…
Cohere: покупка Reliant AI и фокус на фармацевтике
Компания Cohere сделала ставку на корпоративный ИИ в медицине, приобретя Reliant AI — фирму, специализирующуюся на суверенных решениях для здравоохранения и биофармацевтики. Этот шаг стратегически совпадает с…
Глава Cohere назвал Торонто центром вселенной
В мире, где Кремниевая долина и крупные технологические хабы часто заявляют о своем превосходстве, один из лидеров AI-индустрии высказал неожиданное мнение. Эйдан Гомес, сооснователь и CEO Cohere, предложил взглянуть на…
Сооснователь Cohere: «i am ice man» – о чем это?
Иван Чжан, соучредитель и технический директор компании Cohere, опубликовал на своей странице в X короткое, но крайне лаконичное личное сообщение. Этот пост, состоящий всего из нескольких фраз, вызвал вопросы из-за…
Cohere намекает на новую инициативу «Project Pursue» и ищет истину в данных
Загадочное сообщение «The truth is out there…» появилось сегодня в аккаунте Cohere на X, сопровождаемое ссылкой на новую страницу «Project Pursue» на их официальном веб-сайте. Деталей инициативы пока нет, но это…
Runway Agent: видео целиком за один диалог
Runway представила Runway Agent, креативного ИИ-партнера, который призван упростить процесс создания готового к публикации видеоконтента. От первоначальной идеи до финального ролика с несколькими сценами, озвучкой и…
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
AssemblyAI: когда JSON самоисправляется, а голоса чётко делятся по словам
Работа с моделями в продакшене всегда подразумевает компромиссы: LLM могут «глючить» с JSON-форматом, а аудиомодели — неточно разделять голоса в потоке. На этой неделе AssemblyAI показала два обновления, которые решают…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
Gemini 3 Pro Image: когда промпт — это полотно, а референсов полдюжины
Runway выпустил новую модель для генерации изображений — Gemini 3 Pro Image. Она же Nano Banana Pro, или gemini_image3_pro в API. Модель заточена под детализированные текстовые запросы и множество референсных…
Voice Agent API: «позвонилка» с LLM-мозгом в один WebSocket
AssemblyAI Voice Agent API — это единый конвейер для создания голосовых агентов, который умеет понимать речь, рассуждать на базе LLM и генерировать голос. Он упакован в один WebSocket и позволяет обойтись без сложной…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
PII Redaction: два транскрипта в одном запросе — удобно для UI, но не без подвоха
Соблюдение конфиденциальности данных и обеспечение полноты информации часто идут рука об руку с компромиссами. Например, когда PII Redaction скрывает персональные данные в транскриптах, это хорошо для безопасности, но…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
Claude Opus 4.7 на LLM Gateway AssemblyAI: доступ к интеллекту Anthropic
AssemblyAI, известный своей платформой для работы с аудио, добавил поддержку новейшей модели Claude Opus 4.7 в свой LLM Gateway. Это значит, что инженеры теперь могут использовать одну из самых интеллектуальных моделей…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Cohere убирает Embed v2 и Aya 8B: что делать с кодом?
Если вы используете старые модели Cohere для эмбеддингов или чата, возможно, ваши сервисы уже столкнулись с ошибками. С 4 апреля Cohere полностью вывел из эксплуатации пять моделей API, включая версии Embed v2.0 и Aya…
Cohere расширяет горизонты: новая модель ASR Transcribe
Cohere, до сих пор преимущественно известный своими сильными позициями в области обработки естественного языка, сделал неожиданный, но логичный шаг в сторону нового домена — автоматического распознавания речи. Этот…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…
Runway: $315 млн на «модели мира» и Gen-4.5 в API
Runway привлекла 315 миллионов долларов в рамках финансирования Серии E для ускорения разработки так называемых «модели мира». Эти инвестиции пойдут на тренировку следующего поколения фундаментальных AI, которые могут…
Cohere Rerank v4.0: ранжирование данных теперь с двумя режимами
Для инженеров, которые разрабатывают поисковые и рекомендательные системы, качество и задержка моделей переранжирования напрямую влияют на пользовательский опыт. Cohere обновила свою основную модель ранжирования…