Новости AI-стека
Daily · свежие материалы
Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI
Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.
Hugging Face: Синхронизация дельта-весов в TRL сокращает передачу данных с терабайта до мегабайт
Hugging Face представила новую функцию в библиотеке TRL, значительно уменьшающую объем данных для синхронизации весов в асинхронном обучении с подкреплением.
Grok в Kilo Code: подписка вместо API-ключа для агентного кодинга
xAI представила прямую подписочную интеграцию моделей Grok, включая Grok Build, в платформу Kilo Code для пользователей X Premium+ и SuperGrok, устраняя необходимость в API-ключах.
Hugging Face Hub: Важный Hotfix устраняет проблемы с typer
Изменения в библиотеке Typer версии 0.26.0 привели к критическим сбоям в работе командной строки Hugging Face Hub, что потребовало незамедлительного выпуска исправления v1.16.3.
Grok Build: агент для кода прямо в терминале
xAI представила раннюю бета-версию Grok Build — мощного агента для кодирования в командной строке, доступного подписчикам SuperGrok и X Premium Plus.
Hugging Face: наводим порядок в терминологии AI-агентов
Hugging Face предлагает стандартизированный глоссарий для устранения путаницы в ключевых понятиях AI-агентов, обеспечивая общее понимание в быстроразвивающейся области.
Специализированные модели: 3B-решения опережают флагманы по всем фронтам
Последние три года в AI-стратегии компаний доминировала простая логика: чем крупнее фронтир-модель, тем безопаснее. Считалось, что возможности масштабируются с числом параметров, а лидеры бенчмарков неизменно предлагают…
DeepSeek-V4-Pro: дисконт, ставший бессрочным
DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…
Grok: не только в браузере — теперь через OpenClaw
xAI запустила интеграцию Grok с OpenClaw, позволяя пользователям с подписками SuperGrok или X Premium запускать модели Grok внутри этого open-source локального агента. Этот шаг переносит возможности Grok из облака на…
Transformers 5.9.0: новые модели и меняющийся интерфейс эмбеддингов
HuggingFace выпустил библиотеку Transformers v5.9.0, добавив три новые модели и внеся важные изменения в обработку текстовых эмбеддингов для ряда моделей компьютерного зрения. Это обновление включает как новые…
Ettin Reranker: как пересортировать поиск без лишних затрат
Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
DeepSeek: V4-модели с контекстом 1M токенов и деприкация старых API
DeepSeek обновил свой API, представив новое поколение моделей с увеличенным контекстом и объявив о скором прекращении поддержки старых версий. Разработчикам, использующим DeepSeek, предстоит запланировать миграцию.
Grok Voice Think Fast 1.0: Не просто слушает, но и думает без пауз
xAI представила свою новую флагманскую голосовую модель Grok Voice Think Fast 1.0, разработанную для сложных и многоэтапных диалогов. Эта модель позиционируется как ключевой инструмент для автоматизации клиентской…
DeepSeek-V4: Контекст в 1M токенов и гибридная архитектура внимания
DeepSeek AI представила новую серию моделей DeepSeek-V4, включая DeepSeek-V4-Pro и DeepSeek-V4-Flash. Главная особенность обеих версий — поддержка контекстного окна в один миллион токенов, что переводит их в лигу…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…
DeepSeek-V3.2: Две модели и временный чемпион по рассуждению
Необычный шаг от DeepSeek: наряду с регулярным обновлением до версии deepseek-v3-2, компания выпустила крайне производительную, но временную модель deepseek-v3-2-speciale. Это создает интересную дилемму для…
DeepSeek-V3.2-Exp: разреженное внимание ускоряет длинный контекст и снижает цены
Когда провайдеры моделей радикально меняют архитектуру, это обычно означает одно из двух: либо решаются фундаментальные проблемы производительности, либо открываются новые возможности для разработчиков. В случае с…
DeepSeek-V3.1-Terminus: фокус на консистентность и агентов
Гибридные модели, совмещающие разные языки, часто привносят неожиданные артефакты в выводе. DeepSeek выпустил обновление V3.1-Terminus для своих моделей deepseek-chat и deepseek-reasoner, заявленная цель которого — не…
DeepSeek-V3.1: Гибридная архитектура объединяет мысль и скорость
DeepSeek выпустил новую модель deepseek-v3-1, которая стирает границу между режимами «думающий» (thinking) и «недумающий» (non-thinking). Теперь эти два подхода объединены в единую гибридную архитектуру, что должно…
DeepSeek-R1-0528: Новые возможности рассуждения и функции
На рынке LLM, где каждый новый релиз обещает "лучшую логику", DeepSeek делает конкретный шаг с обновлением своей модели deepseek-reasoner до версии deepseek-r1-0528. Этот релиз не просто заявляет об улучшениях, но и…
DeepSeek-R1: Новое поколение моделей рассуждений и открытый исходный код
Когда речь заходит о больших языковых моделях, производительность в задачах рассуждений (reasoning), математики и кодирования часто становится главным камнем преткновения. Как добиться паритета с лидерами рынка…