Новости AI-стека
Daily · свежие материалы
Документация OpenAI теперь сама пишет гайды под ваш проект и отдаёт их в Codex
Агент на developers.openai.com понимает контекст задачи — генерирует кастомное руководство, а не просто ищет по тексту.
GPT-5.5 в Codex упал в прод — и тем самым подтвердил своё существование
Параллельно лежала половина API OpenAI — от Batch до Sora.
Астрофизик использует Codex, чтобы найти алгоритмы для симуляции чёрных дыр
Модель предлагает математические схемы, учёный проверяет каждую на известных решениях — ошибки допустимы, потому что наука сама фильтрует.
OpenAI и Oracle: модели и Codex доступны через существующий Oracle-контракт
Новый закупочный путь не нужен — Oracle Universal Credits, которые уже есть у компании, засчитываются напрямую.
Цифра «80% работников под угрозой ИИ» устарела — Cohere Labs объясняет почему
Один показатель из 2023 года правит дискуссией в парламентах — хотя три его ограничения накапливаются, а не просто суммируются.
Китайские операции влияния атаковали дебаты об AI в США — и распускали фейки о ChatGPT
OpenAI заблокировала два кластера аккаунтов и опубликовала детали кампаний — впервые с прямым указанием на КНР.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
GPT-5.5 открыл 23 000 китайских научных статей — без OCR-конвейера
Один разработчик убрал целую цепочку инструментов и получил переводы полнее, чем раньше.
Cohere выпустила North Mini Code — первую открытую модель для кода под Apache 2.0
Маленькая, бесплатная и работает локально — намеренный разворот от корпоративного закрытого AI.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
North-Mini-Code-1.0 от Cohere запускается на локальном железе — без облака
30B параметров суммарно, но в работе — только 3B; Apache 2.0, контекст 256K.
Cohere открыла Tiny Aya и Transcribe — модели до 3.3B, работающие без облака
Transcribe в 3× быстрее аналогов по пропускной способности и занял первое место на Open ASR Leaderboard по английскому.
ChatGPT теперь отправляет письма прямо из чата — и строит интерактивные графики
Нужны подключённые Gmail или Outlook; интерактивные диаграммы и полноэкранный редактор — только в веб-версии.
Qwen3.7-Plus видит экран, управляет GUI и пишет код — в одном агентном цикле
Входные токены — $0.40 за миллион, контекст — 1 млн токенов; работает из Claude Code, Cursor и Cline без дополнительной настройки.
Codex, ChatGPT и Responses API одновременно давали ошибки — всё устранено
Под удар попал и compaction в Codex — механизм сжатия контекста для длинных агентских сессий.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
ИИ для фармацевтики научился сам писать код в экспериментах
Обновлённый GPT-Rosalind от OpenAI теперь не только анализирует данные, но и самостоятельно выполняет шаги в реальных научных исследованиях.
Cohere Labs открыла бесплатный инструмент для построения графиков
Co/plot позволяет быстро менять и уточнять графики без перезапуска скриптов и ручной перерисовки данных.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Qwen App открылся для сторонних агентов: KFC, Luckin Coffee и Mixue первыми в очереди
100 млн ежедневных взаимодействий и долгосрочная память агентов — что это значит для брендов-интеграторов.
ChatGPT Pro лёг по всем фронтам — и поднялся
Сколько компонентов затронул один инцидент у самого дорогого тарифа.
Codex теперь деплоит сайты и работает как ролевой специалист
GPT-5.5 и Codex вышли в general availability на AWS Bedrock — без наценки поверх OpenAI-тарифов.
Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира
Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
ChatGPT Sites: openai запустил хостинг JS/TS-приложений внутри Enterprise-воркспейса
openai открыл превью ChatGPT Sites для Enterprise и Edu — теперь можно собирать и деплоить полнофункциональные веб-приложения с хостингом, авторизацией через ChatGPT и хранилищем данных, не покидая корпоративный…
OpenAI на AWS Bedrock: frontier-модели и Codex теперь в вашем AWS-аккаунте
1 июня OpenAI и AWS открыли общий доступ к frontier-моделям (включая GPT-5.5) и Codex в Amazon Bedrock. Предприятия подключают их через уже существующие IAM-политики, корпоративный биллинг и compliance-процессы — без…
GPT-5.5 и Codex пришли на Amazon Bedrock — без наценки и с вашим IAM
OpenAI и AWS перевели в general availability GPT-5.5, GPT-5.4 и Codex на Amazon Bedrock — впервые frontier-модели OpenAI доступны внутри AWS-инфраструктуры с нативными контролями безопасности и без дополнительных сборов…
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…