Новости AI-стека
Daily · свежие материалы
Документация OpenAI теперь сама пишет гайды под ваш проект и отдаёт их в Codex
Агент на developers.openai.com понимает контекст задачи — генерирует кастомное руководство, а не просто ищет по тексту.
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
GPT-5.5 в Codex упал в прод — и тем самым подтвердил своё существование
Параллельно лежала половина API OpenAI — от Batch до Sora.
nn.Linear под профилировщиком: transpose не трогает GPU
Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.
Астрофизик использует Codex, чтобы найти алгоритмы для симуляции чёрных дыр
Модель предлагает математические схемы, учёный проверяет каждую на известных решениях — ошибки допустимы, потому что наука сама фильтрует.
OpenAI и Oracle: модели и Codex доступны через существующий Oracle-контракт
Новый закупочный путь не нужен — Oracle Universal Credits, которые уже есть у компании, засчитываются напрямую.
Китайские операции влияния атаковали дебаты об AI в США — и распускали фейки о ChatGPT
OpenAI заблокировала два кластера аккаунтов и опубликовала детали кампаний — впервые с прямым указанием на КНР.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
GPT-5.5 открыл 23 000 китайских научных статей — без OCR-конвейера
Один разработчик убрал целую цепочку инструментов и получил переводы полнее, чем раньше.
Hugging Face Spaces стали API-блоками для агентов — 3D-галерея Парижа без единой строки интеграции
Файл agents.md отдаёт схему, эндпоинты и инструкцию по загрузке файлов одним curl — агент читает и сразу вызывает Space.
ChatGPT теперь отправляет письма прямо из чата — и строит интерактивные графики
Нужны подключённые Gmail или Outlook; интерактивные диаграммы и полноэкранный редактор — только в веб-версии.
OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление
Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.
Her читает JSONL-логи Claude Code и находит рискованные действия агента
Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.
Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU
Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.
Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри
100% валидный JSON, но агент покупал то, что сам производил — пока промпт не починили.
Sculpt4D от Tencent ARC генерирует 4D-объекты из видео — на 56% дешевле полного внимания
Модель надстроена над Hunyuan3D 2.1 и уже открыта на Hugging Face — но время инференса и лицензия не раскрыты.
DPO убрал петли повторений в OCR-моделях — минус 59% дегенерации там, где SFT упёрся в потолок
Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.
Codex, ChatGPT и Responses API одновременно давали ошибки — всё устранено
Под удар попал и compaction в Codex — механизм сжатия контекста для длинных агентских сессий.
ИИ для фармацевтики научился сам писать код в экспериментах
Обновлённый GPT-Rosalind от OpenAI теперь не только анализирует данные, но и самостоятельно выполняет шаги в реальных научных исследованиях.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes
В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.
ChatGPT Pro лёг по всем фронтам — и поднялся
Сколько компонентов затронул один инцидент у самого дорогого тарифа.
Codex теперь деплоит сайты и работает как ролевой специалист
GPT-5.5 и Codex вышли в general availability на AWS Bedrock — без наценки поверх OpenAI-тарифов.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
ChatGPT Sites: openai запустил хостинг JS/TS-приложений внутри Enterprise-воркспейса
openai открыл превью ChatGPT Sites для Enterprise и Edu — теперь можно собирать и деплоить полнофункциональные веб-приложения с хостингом, авторизацией через ChatGPT и хранилищем данных, не покидая корпоративный…
OpenAI на AWS Bedrock: frontier-модели и Codex теперь в вашем AWS-аккаунте
1 июня OpenAI и AWS открыли общий доступ к frontier-моделям (включая GPT-5.5) и Codex в Amazon Bedrock. Предприятия подключают их через уже существующие IAM-политики, корпоративный биллинг и compliance-процессы — без…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
GPT-5.5 и Codex пришли на Amazon Bedrock — без наценки и с вашим IAM
OpenAI и AWS перевели в general availability GPT-5.5, GPT-5.4 и Codex на Amazon Bedrock — впервые frontier-модели OpenAI доступны внутри AWS-инфраструктуры с нативными контролями безопасности и без дополнительных сборов…