Новости AI-стека
Daily · свежие материалы
Meta бесплатно раздаст Ray-Ban AI-очки 130 000 слепым ветеранам США
Аналогичные устройства конкурентов стоят до $5 000 — здесь цена для ветерана равна нулю.
Meta арендует у Reliance дата-центр на 168 МВт — первый ИИ-объект компании в Индии
Плюс почти 1 ГВт новых контрактов на возобновляемую энергию — инфраструктурный и энергетический вопрос закрыты разом.
Meta вложила $115 млн в обучение электриков и сварщиков — с гарантией трудоустройства
Программа покрывает все расходы участников: учёбу, перелёт, жильё и суточные — без студенческих долгов.
Sculpt4D от Tencent ARC генерирует 4D-объекты из видео — на 56% дешевле полного внимания
Модель надстроена над Hunyuan3D 2.1 и уже открыта на Hugging Face — но время инференса и лицензия не раскрыты.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Meta Business Agent: AI-агент для бизнеса уже на WhatsApp и Instagram
Старт бесплатный, но в ближайшие месяцы — платная подписка; более 1 млн бизнесов уже используют раннюю версию.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Stable Audio 3: открытая модель для музыки и звуков с инпейнтингом
Stability AI выпустила Stable Audio 3 — новую открытую модель для генерации и редактирования аудио. Эта модель представляет собой семейство быстрых латентных диффузионных моделей, способных создавать аудио переменной…
Stability AI: Как новый автоэнкодер SAME ускоряет генерацию аудио в Stable Audio 3
Stability AI представила SAME (Semantically-Aligned Music Autoencoder) — открытый автоэнкодер, который призван изменить подходы к работе с музыкальными и общими аудиоданными. Его основная задача — эффективное сжатие…
Business AI в WhatsApp: Meta дает ИИ-помощников для малого бизнеса — но пока только в Индии
Meta запустила в Индии функцию Business AI для WhatsApp Business App, предлагая малому бизнесу автоматизированные ответы на запросы клиентов и управление продажами прямо в приложении. Это решение, доступное на всех…
StereoCrafter2: Tencent ARC Lab обновила модель для иммерсивного видео
Tencent ARC Lab выпустила обновление своей модели StereoCrafter, получившее название StereoCrafter2. Новая версия нацелена на решение ключевой проблемы в производстве иммерсивного видео: достижение высокой точности и…
Hy-MT2: многоязычный перевод для сложных сценариев — с оптимизацией для устройств
Tencent Hunyuan выпустила семейство многоязычных моделей перевода Hy-MT2, разработанных для сложных реальных сценариев. Модели доступны в размерах 1.8B, 7B и 30B-A3B (MoE), поддерживают 33 языка и демонстрируют…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Pixal3D-D от Tencent: 3D-модель представлена без документации
Tencent ARC Lab представила Pixal3D-D — новую модель для 3D-генерации, которая появилась на Hugging Face. Однако, несмотря на релиз, публичной документации или детального описания, как это часто бывает, пока нет.
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
**Формат координат и ответа:**
Точка: (x, y) или [(x1, y1), (x2, y2)] Коробка: [xmin, ymin, xmax, ymax] Координаты нормализованы до целочисленного диапазона (0, 1000). В режиме thinking mode ответы структурированы как…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Muse Spark: Meta AI ставит на мультимодальность и параллельное мышление для «персонального сверхинтеллекта»
Meta AI представила muse-spark, первую модель нового семейства Muse, разработанного Meta Superintelligence Labs. Ключевая особенность — нативная мультимодальность и режим contemplating-mode, который позволяет модели…
SAM 3.1: Видео, 3D, и открытый мир — Meta AI ускоряет восприятие
Meta AI представила sam-3-1, обновленную модель Segment Anything Model, которая меняет подход к обработке видео. Главное нововведение — мультиплексирование объектов, позволяющее отслеживать до 16 целей за один проход и…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…
Stable Audio: Warner Music Group и Stability AI создадут этичный AI для музыки
Warner Music Group и Stability AI объявили о партнёрстве, цель которого — разработка нового поколения инструментов для создания музыки с использованием ответственного подхода к искусственному интеллекту. Этот союз…
Foley Control: Звук в видео без переобучения тяжелых моделей
Stability AI представила foley-control, новый метод для генерации реалистичных звуковых эффектов (фоли) на основе видео. Подход позволяет добавлять синхронизированные звуки к видео без необходимости переобучать крупные…