Новости AI-стека
Daily · свежие материалы
Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира
Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.
Project Glasswing расширяется до 150 организаций — Anthropic готовится к миру, где Mythos-класс станет массовым
Bottleneck сместился с поиска уязвимостей на их верификацию и патчинг — и это меняет всю модель киберзащиты.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.
Holo3.1: computer-use агент теперь работает локально и на мобильных
Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…
Claude Code 2.1.161: параллельные инструменты больше не падают цепочкой
Anthropic выпустила Claude Code v2.1.161 с двумя изменениями, напрямую влияющими на агентные пайплайны: отказ одного Bash-вызова в параллельном батче больше не отменяет остальные, а регрессия managed-политик, сломавшая…
Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков
JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.
Anthropic подала конфиденциальный S-1 на IPO
Anthropic, PBC конфиденциально подала черновик регистрационного заявления S-1 в SEC — первый шаг к IPO компании, которая за полгода выросла с оценки $350 млрд до $965 млрд и пересекла отметку $47 млрд годовой выручки.
Gemini 2.0 Flash отключён — что ставить вместо него
1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…
Anthropic подала конфиденциальный S-1 в SEC
Через три дня после закрытия раунда Series H на $65B при оценке $965B Anthropic конфиденциально подала регистрационное заявление S-1 в SEC — первый формальный шаг к IPO. Интересно здесь не то, что компания идёт на…
Quick BI против галлюцинирующих агентов: почему данные важнее модели
На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…
Cohere Labs идёт на хакатон Hugging Face со своими малыми моделями
Cohere Labs поддержала хакатон «Build. Small.» от Hugging Face и Gradio, назвав Tiny Aya и Cohere Transcribe рекомендованными моделями для участников. Это первое явное позиционирование компании в нише компактных моделей…
v2.1.159
Выпущена версия v2.1.159 с внутренними улучшениями инфраструктуры без изменений, видимых пользователям.
Claude Code: автоматический режим пришёл на все основные платформы
Anthropic расширяет автоматический режим Claude Code версии 2.1.158 на все основные облачные платформы, отменяя требование согласия на использование.
Выпущен smolagents v1.26.0
В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.
Cohere Labs анонсирует новое исследование Self-Verified RL с использованием Soft-Rewards
Модель Command A+ превзошла конкурентов в машинном переводе, параллельно компания представила новаторское исследование Soft-SVeRL.
Ноа Цвебен (менеджер по продукту Claude Code) делится интересным вариантом использования: Go bun go
Сотрудники Anthropic поделились деталями использования Claude Code, включая ускорение разработки для Salesforce и эффективное взаимодействие с Go и ORM Bun.
Cog: потоки событий для предсказаний и новые предупреждения
Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.
Qwen-VLA: От осмысления к активному вмешательству в реальный мир
Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.
Снижение производительности flux-2-klein-4b
Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.
Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI
Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.
Сообщение от Ивана Чжана (сооснователя и технического директора Cohere)
Неофициальный пост в X (ранее Twitter) от сооснователя и технического директора Cohere Ивана Чжана, содержащий краткое личное сообщение.
Anthropic выпустил Claude Opus 4.8
Anthropic представила обновленную модель Claude Opus 4.8 с улучшенными возможностями кодирования и новыми функциями, одновременно объявив о привлечении $65 млрд в раунде финансирования Серии H.
We've launched Claude Opus 4.8 ( claude-opus-4-8 ), our most capable generally a...
Anthropic выпустила флагманскую модель Claude Opus 4.8 с расширенным контекстным окном, улучшенными возможностями для агентских задач и новыми функциями управления диалогом.
Gemini Image Models: видео в картинку, но не для всех
Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.
qwen-cloud: облако, где агенты говорят на одном языке
Alibaba Cloud представила Qwen Cloud 26 мая в Сингапуре, создав AI-нативную платформу для работы с агентами и мультимодальными моделями.
Cohere: «Языковое замешательство» скрывает пробелы в безопасности многоязычных моделей
Новое исследование Cohere Labs выявило, что бинарные системы оценки безопасности не способны адекватно реагировать на «языковое замешательство» в многоязычных ИИ-моделях, делая их ложно безопасными.
Hugging Face: Синхронизация дельта-весов в TRL сокращает передачу данных с терабайта до мегабайт
Hugging Face представила новую функцию в библиотеке TRL, значительно уменьшающую объем данных для синхронизации весов в асинхронном обучении с подкреплением.
Alibaba Cloud: комплексная экосистема для агентного ИИ и глобального масштаба
На первой международной конференции Qwen в Сингапуре Alibaba Cloud представила новые модели, инфраструктуру и инструменты для построения и управления ИИ-агентами.
Claude Code учится не только ревьюить код, но и применять исправления
Обновление Claude Code v2.1.152 внедряет функцию /code-review --fix, позволяющую ИИ не только выявлять, но и автоматически применять предложенные исправления непосредственно в рабочее дерево проекта.
Cohere: Зачем CEO едет в Хайльбронн, чтобы обсудить «суверенный AI»?
Генеральный директор Cohere Эйдан Гомес примет участие в европейской конференции, подчеркивая глобальные амбиции компании в области суверенного ИИ и безопасной реализации корпоративных решений.