Новости AI-стека
Daily · свежие материалы
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
ChatGPT Sites: openai запустил хостинг JS/TS-приложений внутри Enterprise-воркспейса
openai открыл превью ChatGPT Sites для Enterprise и Edu — теперь можно собирать и деплоить полнофункциональные веб-приложения с хостингом, авторизацией через ChatGPT и хранилищем данных, не покидая корпоративный…
Runway вложит $100 млн в лондонский хаб по world models
$100 млн за 18 месяцев и удвоение суммы к 2028 году — Runway объявляет Лондон европейской штаб-квартирой и исследовательским центром по general world models. Это первая крупная географическая ставка компании за…
OpenAI на AWS Bedrock: frontier-модели и Codex теперь в вашем AWS-аккаунте
1 июня OpenAI и AWS открыли общий доступ к frontier-моделям (включая GPT-5.5) и Codex в Amazon Bedrock. Предприятия подключают их через уже существующие IAM-политики, корпоративный биллинг и compliance-процессы — без…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
GPT-5.5 и Codex пришли на Amazon Bedrock — без наценки и с вашим IAM
OpenAI и AWS перевели в general availability GPT-5.5, GPT-5.4 и Codex на Amazon Bedrock — впервые frontier-модели OpenAI доступны внутри AWS-инфраструктуры с нативными контролями безопасности и без дополнительных сборов…
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…
OpenAI Robotics: из симуляции — в железо
Исследовательская программа симуляции мира в OpenAI стала отдельным подразделением — OpenAI Robotics — и компания открыла найм full-stack-инженеров для разработки и производства физических роботов. Это не очередное…
Грег Брокман (соучредитель и президент OpenAI) отмечает, что «здорово создавать с Codex»
Грег Брокман из OpenAI отмечает прогресс Codex для нетехнических пользователей, а новые подходы к голосовым агентам демонстрируют потенциал интерактивного взаимодействия в реальном времени.
OpenAI запускает Rosalind Biodefense для ускорения прогресса в биологической защите
Инициатива Rosalind Biodefense усиливает биобезопасность с помощью ИИ, а Codex для Windows получает функцию «Компьютерное использование».
Детская больница Бостона использует ИИ для новых диагнозов
OpenAI расширяет применение своих моделей в здравоохранении, разработке ПО и биозащите, одновременно усиливая независимую оценку ИИ.
Выпущен smolagents v1.26.0
В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.
happyhorse: генерация видео с контролем длительности и формата
HappyHorse 1.0, разработанная Alibaba, стала доступна через API-партнера fal, предлагая расширенный контроль над длительностью и форматом видео.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Seedance 2.0 теперь доступен через API Runway
Модель Seedance 2.0, разработанная сторонней командой, теперь доступна через API Runway, предлагая расширенные функции для генерации видео из различных типов данных.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Грег Брокман (сооснователь и президент OpenAI) призывает сообщать об ошибках ChatGPT
Грег Брокман призвал пользователей сообщать об ошибках ChatGPT; компания также анонсировала партнерство в автоспорте и новые исследовательские инициативы.
Рамочная программа управления приграничными технологиями OpenAI
OpenAI представила новую рамочную программу управления приграничными технологиями, призванную гармонизировать подходы к безопасности с требованиями регулирования, на фоне демонстрации успешных бизнес-кейсов и устранения…
Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI
Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.
Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским
Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.
Gemini Image Models: видео в картинку, но не для всех
Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.
OpenAI расширяет границы ИИ: самосовершенствующиеся агенты, кибербезопасность GPT-5.5 и инвестиции в экономическое будущее
OpenAI анонсировала автономных агентов на базе Codex, значительно усиленную модель GPT-5.5 для кибербезопасности и масштабную инициативу по формированию справедливого экономического будущего в эпоху ИИ.
Gemini 3.5 Flash в Deepgram: быстрее, эффективнее, но пора мигрировать
Deepgram интегрировал модель Gemini 3.5 Flash в Voice Agent API, требуя от пользователей Gemini 2.5 Flash мигрировать до октября из-за предстоящего прекращения поддержки.
Hugging Face: Синхронизация дельта-весов в TRL сокращает передачу данных с терабайта до мегабайт
Hugging Face представила новую функцию в библиотеке TRL, значительно уменьшающую объем данных для синхронизации весов в асинхронном обучении с подкреплением.
Runway Seedance: инцидент с генерациями быстро устранен
На платформе Runway 27 мая 2026 года произошел кратковременный инцидент с генерациями Seedance, который был устранен за 33 минуты.
OpenAI: Инцидент затронул вход в систему FedRAMP
Сбой, затронувший вход в систему для государственных пользователей, недавно вышедших из аккаунта, был полностью устранен 27 мая 2026 года.
Codex и GPT-5.5: OpenAI видит анализ Slack и кодинг на iPad
Руководители OpenAI в X анонсировали расширение Codex для анализа Slack и использования на iPad, улучшение GPT-5.5 для кодинга и отметили рост активности сообщества разработчиков.
Vertex AI Extensions уходят: Google переводит фокус на Agent Platform
Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.