Новости AI-стека
Daily · свежие материалы
Claude Managed Agents берёт инфраструктуру агента на себя — команде остаётся доменная логика
Harness обновляется вместе с моделью: то, что ломало агент на Sonnet 4.5, на Opus 4.5 уже не нужно.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
GitHub Copilot CLI теперь ищет уязвимости прямо в терминале
Команда /security-review работает независимо от Code Scanning и Dependabot — как отдельный, более ранний рубеж защиты.
GPT-5.5 открыл 23 000 китайских научных статей — без OCR-конвейера
Один разработчик убрал целую цепочку инструментов и получил переводы полнее, чем раньше.
Cohere выпустила North Mini Code — первую открытую модель для кода под Apache 2.0
Маленькая, бесплатная и работает локально — намеренный разворот от корпоративного закрытого AI.
Claude Fable 5 вышел для всех — с отключёнными опасными возможностями
Полная версия Mythos 5 доступна только киберзащитникам через государственную программу — остальные получают модель с фильтрами, которые срабатывают в среднем в менее чем 5% сессий.
Claude Fable 5 вышел с 1M контекстом — но мышление не отключить и данные хранятся 30 дней
Новый токенизатор генерирует на 30% больше токенов — реальная стоимость выше, чем кажется по прайсу $10/$50 за миллион.
GitHub проверяет код от Claude и Codex так же, как от Copilot
Три слоя защиты — CodeQL, проверка зависимостей и сканирование секретов — без лицензии Advanced Security.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
North-Mini-Code-1.0 от Cohere запускается на локальном железе — без облака
30B параметров суммарно, но в работе — только 3B; Apache 2.0, контекст 256K.
Cohere открыла Tiny Aya и Transcribe — модели до 3.3B, работающие без облака
Transcribe в 3× быстрее аналогов по пропускной способности и занял первое место на Open ASR Leaderboard по английскому.
Claude не может надёжно скачать вирусные геномы — и это не баг модели
Детерминированный слой поверх NCBI поднимает точность с 16–91% до почти 100% — значит, проблема не в модели.
Microsoft Foundry даёт агентам память между сессиями — без внешней базы данных
Состояние хранится в изолированной microVM на сервере; клиент знает только session id.
Авторы коннекторов для Claude получили дашборд с метриками и ошибками
Подать коннектор в каталог теперь можно прямо из интерфейса — без отдельных форм.
ChatGPT теперь отправляет письма прямо из чата — и строит интерактивные графики
Нужны подключённые Gmail или Outlook; интерактивные диаграммы и полноэкранный редактор — только в веб-версии.
Claude Opus 4.7 предсказывает ЯМР-спектры так же точно, как ChemDraw
И в обратную сторону: модель восстанавливает структуру молекулы из спектра — без лицензионного ПО и специальной настройки.
GPT-5.2 и GPT-5.2-Codex убраны из GitHub Copilot
Chat, автодополнение и agent-режим перешли на GPT-5.5 и GPT-5.3-Codex — от пользователей действий не требуется, но Enterprise-администраторам стоит проверить политики моделей.
Codex, ChatGPT и Responses API одновременно давали ошибки — всё устранено
Под удар попал и compaction в Codex — механизм сжатия контекста для длинных агентских сессий.
ИИ для фармацевтики научился сам писать код в экспериментах
Обновлённый GPT-Rosalind от OpenAI теперь не только анализирует данные, но и самостоятельно выполняет шаги в реальных научных исследованиях.
Cohere Labs открыла бесплатный инструмент для построения графиков
Co/plot позволяет быстро менять и уточнять графики без перезапуска скриптов и ручной перерисовки данных.
ИИ превращает неопытных хакеров в серьёзную угрозу
Anthropic год отслеживала реальные атаки через свою модель и выяснила, что ИИ теперь сам выполняет сложные этапы взлома вместо человека.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
GitHub Copilot запускает агентов на удалённых машинах — сессия не умирает при отключении
Плюс BYOK в изолированных сетях, оценка риска команд и синхронизация истории между устройствами.
ChatGPT Pro лёг по всем фронтам — и поднялся
Сколько компонентов затронул один инцидент у самого дорогого тарифа.
Код больше не узкое место: как Anthropic перестроила инженерные процессы под агентное кодирование
Директор по инжинирингу Claude Code Фиона Фунг на конференции Code w/ Claude SF 2026 разобрала, что конкретно сломалось в старых процессах, когда агентное кодирование стало дефолтным режимом работы — и чем команда это…
Codex теперь деплоит сайты и работает как ролевой специалист
GPT-5.5 и Codex вышли в general availability на AWS Bedrock — без наценки поверх OpenAI-тарифов.
Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира
Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.
Project Glasswing расширяется до 150 организаций — Anthropic готовится к миру, где Mythos-класс станет массовым
Bottleneck сместился с поиска уязвимостей на их верификацию и патчинг — и это меняет всю модель киберзащиты.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.