Бухгалтер с Claude Code успевает не хуже программиста — данные 400 тысяч сессий

Принято считать, что агентные инструменты для кода — удел разработчиков. Anthropic проанализировала 400 тысяч реальных сессий Claude Code и обнаружила: юристы, менеджеры и учёные справляются с задачами почти так же успешно, как инженеры-программисты — если хорошо понимают свою предметную область.

Кто решает что. В типичной сессии человек принимает около 70% решений о планировании — что делать, какой подход выбрать, что считать результатом. Claude берёт на себя около 80% решений об исполнении: какие файлы менять, какой код писать, какие команды запускать. Это устойчивое разделение труда, а не случайность выборки.

Уровень предметной экспертизы напрямую определяет, сколько работы делает агент. В сессиях с экспертами каждый промпт запускает в среднем 12 действий Claude и порождает около 3 200 слов вывода — против 5 действий и 600 слов у новичков. Разрыв сохраняется во всех режимах работы и статистически значим даже с поправкой на тип задачи, месяц и профессию пользователя.

Успех определяет понимание задачи, а не навык кодирования. Все крупные профессиональные группы — юристы, финансисты, учёные, менеджеры — завершают сессии успешно примерно с той же частотой, что и разработчики. Главный скачок в успешности — между новичком и средним уровнем; разрыв между «средним» и «экспертом» куда скромнее. Это означает, что достаточного понимания предметной области хватает, чтобы работать почти так же эффективно, как глубокий специалист.

Характер использования сместился за семь месяцев. Между октябрём 2025-го и апрелем 2026-го:

Отладка — доля сессий упала с 33% до 19%.
Работа с инфраструктурой (деплой, конфигурирование, мониторинг) — выросла с 14% до 21%.
Анализ данных и написание документов — удвоилась, с 10% до 20%.

Вместе с этим выросла расчётная экономическая ценность задач. Anthropic оценивала её через сравнение с ценами на фриланс-биржах: средняя сессия подорожала на 27%. Задачи типа «построить», «запустить» и «починить» прибавили от 32% до 43%.

Исследование формулирует нетривиальный тезис: агенты не заменяют предметную экспертизу, а усиливают её — чем глубже человек понимает задачу, тем больше полезной работы делает агент. Честный пробел: Anthropic не раскрывает абсолютные показатели успешности по профессиям и не объясняет, как именно верифицируется «успех» в задачах без автотестов. Для задач вне разработки — юридических, финансовых, научных — это ключевой вопрос, и пока он остаётся без ответа.

Бухгалтер с Claude Code успевает не хуже программиста — данные 400 тысяч сессий daily

Дополнительные источники

Источники

Оценить материал