Год назад команда с Claude обогнала команду без Claude вдвое. Сегодня Claude Opus 4.7 обогнал обе команды — и сделал это в одиночку, без инженера за клавиатурой. Anthropic опубликовал результаты второй фазы Project Fetch: модель программировала реального робопса автономно и укладывалась в задачи, на которые люди тратили часы.
Opus 4.7 запускали в Claude Code с adaptive thinking на максимальном effort. Он завершил все задачи, с которыми справилась хотя бы одна из человеческих команд: в среднем в 37 раз быстрее команды без Claude и в 18 раз быстрее команды с Claude. Кода при этом написал почти в 10 раз меньше, чем люди, — и большая часть работала с первой попытки. Роль исследователя свелась к подключению ноутбука к робопсу, вводу начального промпта и нажатию «одобрить» на каждом шаге.
Но есть задача, которую модель не осилила. Автономный захват мяча — замкнутый цикл «воспринять положение → скорректировать курс → двинуть робота» — Claude не вытянул: робот двигался неточно, мяч на базу не возвращался. Люди с практикой справлялись руками. Anthropic прямо признаёт: низкоуровневое управление актуаторами и написание политик управления — за пределами текущих возможностей модели. Один опытный инженер-робототехник задачу всё же решил программно, что даёт ориентир для следующей фазы.
Важный контекст: никто специально не учил модель робототехнике. Способности выросли из общего масштабирования — так же, как раньше выросли способности в кибербезопасности. Anthropic проводит явную параллель: та же траектория «помощник → соавтор → автономный агент» теперь воспроизводится в физическом мире.
Anthropic документирует этот переход через собственный красный тим, а не через маркетинговые слайды — это даёт хоть какую-то верифицируемость. Честный пробел: весь эксперимент проведён на одном конкретном робопсе в одной контролируемой среде. Как модель поведёт себя на незнакомом железе и выдержит ли многочасовую автономную работу — данных нет.