Новости AI-стека
Daily · свежие материалы
Runway: Сбои в генерации GPT Image 2 устранены, но Veo 3.1 пока нестабилен
Платформа Runway оперативно решила проблемы с генерацией изображений GPT Image 2, однако сбои в работе Veo 3.1 также были зафиксированы и устранены.
Специализированные модели: 3B-решения опережают флагманы по всем фронтам
Последние три года в AI-стратегии компаний доминировала простая логика: чем крупнее фронтир-модель, тем безопаснее. Считалось, что возможности масштабируются с числом параметров, а лидеры бенчмарков неизменно предлагают…
DeepSeek-V4-Pro: дисконт, ставший бессрочным
DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…
Transformers 5.9.0: новые модели и меняющийся интерфейс эмбеддингов
HuggingFace выпустил библиотеку Transformers v5.9.0, добавив три новые модели и внеся важные изменения в обработку текстовых эмбеддингов для ряда моделей компьютерного зрения. Это обновление включает как новые…
Ettin Reranker: как пересортировать поиск без лишних затрат
Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над…
Stable Audio 3: открытая модель для музыки и звуков с инпейнтингом
Stability AI выпустила Stable Audio 3 — новую открытую модель для генерации и редактирования аудио. Эта модель представляет собой семейство быстрых латентных диффузионных моделей, способных создавать аудио переменной…
Stability AI: Как новый автоэнкодер SAME ускоряет генерацию аудио в Stable Audio 3
Stability AI представила SAME (Semantically-Aligned Music Autoencoder) — открытый автоэнкодер, который призван изменить подходы к работе с музыкальными и общими аудиоданными. Его основная задача — эффективное сжатие…
Runway Agent: видео целиком за один диалог
Runway представила Runway Agent, креативного ИИ-партнера, который призван упростить процесс создания готового к публикации видеоконтента. От первоначальной идеи до финального ролика с несколькими сценами, озвучкой и…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
Gemini 3 Pro Image: когда промпт — это полотно, а референсов полдюжины
Runway выпустил новую модель для генерации изображений — Gemini 3 Pro Image. Она же Nano Banana Pro, или gemini_image3_pro в API. Модель заточена под детализированные текстовые запросы и множество референсных…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
DeepSeek: V4-модели с контекстом 1M токенов и деприкация старых API
DeepSeek обновил свой API, представив новое поколение моделей с увеличенным контекстом и объявив о скором прекращении поддержки старых версий. Разработчикам, использующим DeepSeek, предстоит запланировать миграцию.
DeepSeek-V4: Контекст в 1M токенов и гибридная архитектура внимания
DeepSeek AI представила новую серию моделей DeepSeek-V4, включая DeepSeek-V4-Pro и DeepSeek-V4-Flash. Главная особенность обеих версий — поддержка контекстного окна в один миллион токенов, что переводит их в лигу…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…
Runway: $315 млн на «модели мира» и Gen-4.5 в API
Runway привлекла 315 миллионов долларов в рамках финансирования Серии E для ускорения разработки так называемых «модели мира». Эти инвестиции пойдут на тренировку следующего поколения фундаментальных AI, которые могут…
DeepSeek-V3.2: Две модели и временный чемпион по рассуждению
Необычный шаг от DeepSeek: наряду с регулярным обновлением до версии deepseek-v3-2, компания выпустила крайне производительную, но временную модель deepseek-v3-2-speciale. Это создает интересную дилемму для…
Stable Audio: Warner Music Group и Stability AI создадут этичный AI для музыки
Warner Music Group и Stability AI объявили о партнёрстве, цель которого — разработка нового поколения инструментов для создания музыки с использованием ответственного подхода к искусственному интеллекту. Этот союз…
Foley Control: Звук в видео без переобучения тяжелых моделей
Stability AI представила foley-control, новый метод для генерации реалистичных звуковых эффектов (фоли) на основе видео. Подход позволяет добавлять синхронизированные звуки к видео без необходимости переобучать крупные…
DeepSeek-V3.2-Exp: разреженное внимание ускоряет длинный контекст и снижает цены
Когда провайдеры моделей радикально меняют архитектуру, это обычно означает одно из двух: либо решаются фундаментальные проблемы производительности, либо открываются новые возможности для разработчиков. В случае с…
DeepSeek-V3.1-Terminus: фокус на консистентность и агентов
Гибридные модели, совмещающие разные языки, часто привносят неожиданные артефакты в выводе. DeepSeek выпустил обновление V3.1-Terminus для своих моделей deepseek-chat и deepseek-reasoner, заявленная цель которого — не…
DeepSeek-V3.1: Гибридная архитектура объединяет мысль и скорость
DeepSeek выпустил новую модель deepseek-v3-1, которая стирает границу между режимами «думающий» (thinking) и «недумающий» (non-thinking). Теперь эти два подхода объединены в единую гибридную архитектуру, что должно…
DeepSeek-R1-0528: Новые возможности рассуждения и функции
На рынке LLM, где каждый новый релиз обещает "лучшую логику", DeepSeek делает конкретный шаг с обновлением своей модели deepseek-reasoner до версии deepseek-r1-0528. Этот релиз не просто заявляет об улучшениях, но и…
DeepSeek-R1: Новое поколение моделей рассуждений и открытый исходный код
Когда речь заходит о больших языковых моделях, производительность в задачах рассуждений (reasoning), математики и кодирования часто становится главным камнем преткновения. Как добиться паритета с лидерами рынка…