Новости AI-стека
Daily · свежие материалы
Transformers v5.10.1 закрыл баг, который тихо ломал квантование BitsAndBytes
В том же релизе — четыре новые архитектуры: кодовый MoE от JetBrains и специализированный OCR от DeepSeek.
Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди
100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.
ChatGPT Pro лёг по всем фронтам — и поднялся
Сколько компонентов затронул один инцидент у самого дорогого тарифа.
Codex теперь деплоит сайты и работает как ролевой специалист
GPT-5.5 и Codex вышли в general availability на AWS Bedrock — без наценки поверх OpenAI-тарифов.
Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира
Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
ChatGPT Sites: openai запустил хостинг JS/TS-приложений внутри Enterprise-воркспейса
openai открыл превью ChatGPT Sites для Enterprise и Edu — теперь можно собирать и деплоить полнофункциональные веб-приложения с хостингом, авторизацией через ChatGPT и хранилищем данных, не покидая корпоративный…
OpenAI на AWS Bedrock: frontier-модели и Codex теперь в вашем AWS-аккаунте
1 июня OpenAI и AWS открыли общий доступ к frontier-моделям (включая GPT-5.5) и Codex в Amazon Bedrock. Предприятия подключают их через уже существующие IAM-политики, корпоративный биллинг и compliance-процессы — без…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
GPT-5.5 и Codex пришли на Amazon Bedrock — без наценки и с вашим IAM
OpenAI и AWS перевели в general availability GPT-5.5, GPT-5.4 и Codex на Amazon Bedrock — впервые frontier-модели OpenAI доступны внутри AWS-инфраструктуры с нативными контролями безопасности и без дополнительных сборов…
Composer 2.5 внутри Grok Build: файн-тюн Kimi K2.5 с 25× больше синтетики
xAI выпустила Composer 2.5 — агентную кодинговую модель на базе open-source чекпоинта Moonshot Kimi K2.5, обученную на синтетических задачах в 25 раз интенсивнее предшественника. Интересно тут не сам релиз, а…
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…
Quick BI против галлюцинирующих агентов: почему данные важнее модели
На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…
Cohere Labs идёт на хакатон Hugging Face со своими малыми моделями
Cohere Labs поддержала хакатон «Build. Small.» от Hugging Face и Gradio, назвав Tiny Aya и Cohere Transcribe рекомендованными моделями для участников. Это первое явное позиционирование компании в нише компактных моделей…
OpenAI Robotics: из симуляции — в железо
Исследовательская программа симуляции мира в OpenAI стала отдельным подразделением — OpenAI Robotics — и компания открыла найм full-stack-инженеров для разработки и производства физических роботов. Это не очередное…
Грег Брокман (соучредитель и президент OpenAI) отмечает, что «здорово создавать с Codex»
Грег Брокман из OpenAI отмечает прогресс Codex для нетехнических пользователей, а новые подходы к голосовым агентам демонстрируют потенциал интерактивного взаимодействия в реальном времени.
OpenAI запускает Rosalind Biodefense для ускорения прогресса в биологической защите
Инициатива Rosalind Biodefense усиливает биобезопасность с помощью ИИ, а Codex для Windows получает функцию «Компьютерное использование».
Детская больница Бостона использует ИИ для новых диагнозов
OpenAI расширяет применение своих моделей в здравоохранении, разработке ПО и биозащите, одновременно усиливая независимую оценку ИИ.
Выпущен smolagents v1.26.0
В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.
Cohere Labs анонсирует новое исследование Self-Verified RL с использованием Soft-Rewards
Модель Command A+ превзошла конкурентов в машинном переводе, параллельно компания представила новаторское исследование Soft-SVeRL.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Nova-3 Medical: точность в медицине растет, но что с остальным?
Deepgram обновила свою специализированную модель Nova-3 Medical, значительно повысив точность распознавания медицинских терминов и сохранив качество для общего языка.
Qwen-VLA: От осмысления к активному вмешательству в реальный мир
Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Грег Брокман (сооснователь и президент OpenAI) призывает сообщать об ошибках ChatGPT
Грег Брокман призвал пользователей сообщать об ошибках ChatGPT; компания также анонсировала партнерство в автоспорте и новые исследовательские инициативы.
Рамочная программа управления приграничными технологиями OpenAI
OpenAI представила новую рамочную программу управления приграничными технологиями, призванную гармонизировать подходы к безопасности с требованиями регулирования, на фоне демонстрации успешных бизнес-кейсов и устранения…
Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI
Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.
Сообщение от Ивана Чжана (сооснователя и технического директора Cohere)
Неофициальный пост в X (ранее Twitter) от сооснователя и технического директора Cohere Ивана Чжана, содержащий краткое личное сообщение.
Deepgram Self-Hosted: майский релиз с фильтром ненормативной лексики и улучшенным корейским
Майский релиз Deepgram Self-Hosted 2026 года привносит расширенную фильтрацию ненормативной лексики и повышенную точность для корейского языка, а также важные изменения для будущих архитектурных обновлений движка.