Новости AI-стека

Cohere Labs запускает бенчмарк культурных загадок и ищет экспертов со всего мира

Параллельно — дискуссия о том, нужен ли агентам «язык чувств» для координации.

Project Glasswing расширяется до 150 организаций — Anthropic готовится к миру, где Mythos-класс станет массовым

Bottleneck сместился с поиска уязвимостей на их верификацию и патчинг — и это меняет всю модель киберзащиты.

2 мин

Daily · Replicate · Replicate

Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`

В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.

Holo3.1: computer-use агент теперь работает локально и на мобильных

Hugging Face выпустила Holo3.1 — первую версию своего computer-use семейства с квантованными весами и поддержкой мобильных сред. Главный сдвиг здесь не в бенчмарках, а в том, что агента теперь можно запустить на железе…

Claude Code 2.1.161: параллельные инструменты больше не падают цепочкой

Anthropic выпустила Claude Code v2.1.161 с двумя изменениями, напрямую влияющими на агентные пайплайны: отказ одного Bash-вызова в параллельном батче больше не отменяет остальные, а регрессия managed-политик, сломавшая…

Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков

JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.

Anthropic подала конфиденциальный S-1 на IPO

Anthropic, PBC конфиденциально подала черновик регистрационного заявления S-1 в SEC — первый шаг к IPO компании, которая за полгода выросла с оценки $350 млрд до $965 млрд и пересекла отметку $47 млрд годовой выручки.

Daily · Google · Google

Gemini 2.0 Flash отключён — что ставить вместо него

1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в…

Anthropic подала конфиденциальный S-1 в SEC

Через три дня после закрытия раунда Series H на $65B при оценке $965B Anthropic конфиденциально подала регистрационное заявление S-1 в SEC — первый формальный шаг к IPO. Интересно здесь не то, что компания идёт на…

Daily · Alibaba · Alibaba

Quick BI против галлюцинирующих агентов: почему данные важнее модели

На конференции Qwen в Сингапуре 26 мая 2026 года Lingyang показала Quick BI с одного конкретного факта: три разных корпоративных агента дают три разных определения «выручки», и никто в компании не решается принять…

2 мин

Cohere Labs идёт на хакатон Hugging Face со своими малыми моделями

Cohere Labs поддержала хакатон «Build. Small.» от Hugging Face и Gradio, назвав Tiny Aya и Cohere Transcribe рекомендованными моделями для участников. Это первое явное позиционирование компании в нише компактных моделей…

31 МАЯ

v2.1.159

Выпущена версия v2.1.159 с внутренними улучшениями инфраструктуры без изменений, видимых пользователям.

30 МАЯ

Claude Code: автоматический режим пришёл на все основные платформы

Anthropic расширяет автоматический режим Claude Code версии 2.1.158 на все основные облачные платформы, отменяя требование согласия на использование.

Выпущен smolagents v1.26.0

В новой версии библиотеки smolagents v1.26.0 добавлены улучшения для веб-поиска через Exa и усилена безопасность за счет удаления удаленного WasmExecutor.

5 мин

Cohere Labs анонсирует новое исследование Self-Verified RL с использованием Soft-Rewards

Модель Command A+ превзошла конкурентов в машинном переводе, параллельно компания представила новаторское исследование Soft-SVeRL.

Ноа Цвебен (менеджер по продукту Claude Code) делится интересным вариантом использования: Go bun go

Сотрудники Anthropic поделились деталями использования Claude Code, включая ускорение разработки для Salesforce и эффективное взаимодействие с Go и ORM Bun.

6 мин

Daily · Replicate · Replicate

Cog: потоки событий для предсказаний и новые предупреждения

Предварительный релиз Cog v0.21.0-rc.1 вводит Server-Sent Events для realtime-обновлений предсказаний, а также объявляет cog weights экспериментальным.

5 мин

Daily · Alibaba · Alibaba · TG #331

Qwen-VLA: От осмысления к активному вмешательству в реальный мир

Alibaba представила Qwen-VLA — мультимодальную модель, способную не только понимать визуальные данные, но и действовать в физическом мире.

10 мин

Daily · Replicate · Replicate

Снижение производительности flux-2-klein-4b

Наблюдалось снижение производительности модели flux-2-klein-4b, проблема была решена, и время ожидания вернулось к норме.

Выпущена версия v1.17.0 Hugging Face Hub с кросс-репозиторным копированием, SSH в Spaces и улучшенными таблицами CLI

Версия 1.17.0 клиента Hugging Face Hub управления файлами, отладки в Spaces и навигации по моделям.

8 мин

Сообщение от Ивана Чжана (сооснователя и технического директора Cohere)

Неофициальный пост в X (ранее Twitter) от сооснователя и технического директора Cohere Ивана Чжана, содержащий краткое личное сообщение.

Anthropic выпустил Claude Opus 4.8

Anthropic представила обновленную модель Claude Opus 4.8 с улучшенными возможностями кодирования и новыми функциями, одновременно объявив о привлечении $65 млрд в раунде финансирования Серии H.

We've launched Claude Opus 4.8 ( claude-opus-4-8 ), our most capable generally a...

Anthropic выпустила флагманскую модель Claude Opus 4.8 с расширенным контекстным окном, улучшенными возможностями для агентских задач и новыми функциями управления диалогом.

9 мин

Daily · Google · Google

Gemini Image Models: видео в картинку, но не для всех

Google представила обновленную линейку моделей Nano Banana для генерации и редактирования изображений, а также расширила функции понимания видеоконтента, открывая мультимодальные возможности для разработчиков.

Daily · Alibaba · Alibaba

qwen-cloud: облако, где агенты говорят на одном языке

Alibaba Cloud представила Qwen Cloud 26 мая в Сингапуре, создав AI-нативную платформу для работы с агентами и мультимодальными моделями.

10 мин

Cohere: «Языковое замешательство» скрывает пробелы в безопасности многоязычных моделей

Новое исследование Cohere Labs выявило, что бинарные системы оценки безопасности не способны адекватно реагировать на «языковое замешательство» в многоязычных ИИ-моделях, делая их ложно безопасными.

6 мин

Hugging Face: Синхронизация дельта-весов в TRL сокращает передачу данных с терабайта до мегабайт

Hugging Face представила новую функцию в библиотеке TRL, значительно уменьшающую объем данных для синхронизации весов в асинхронном обучении с подкреплением.

10 мин

Daily · Alibaba · Alibaba

Alibaba Cloud: комплексная экосистема для агентного ИИ и глобального масштаба

На первой международной конференции Qwen в Сингапуре Alibaba Cloud представила новые модели, инфраструктуру и инструменты для построения и управления ИИ-агентами.

9 мин

Claude Code учится не только ревьюить код, но и применять исправления

Обновление Claude Code v2.1.152 внедряет функцию /code-review --fix, позволяющую ИИ не только выявлять, но и автоматически применять предложенные исправления непосредственно в рабочее дерево проекта.

26 МАЯ