AI News Watcher
Tuesday, Apr 14, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Apr 14, 2026 · 2 min read · Anthropic ← Back to feed

Claude: Исследования надзора — теперь полностью автономно, и дешевле людей daily

Anthropic сообщает о новом векторе в исследованиях масштабируемого надзора: модели Claude теперь могут полностью автономно развивать этот процесс, превосходя эффективность команд из людей-исследователей. Этот результат демонстрирует, что AI способен самостоятельно решать сложные исследовательские задачи, причём с неожиданной экономической выгодой.

Hero illustration: Claude: Исследования надзора — теперь полностью автономно, и дешевле людей.

Редакция · Daily briefing

Стоит читать если: вы следите за прогрессом в области AI-выравнивания, автономных исследовательских агентов или интересуетесь экономической эффективностью AI в R&D. Можно пропустить если: вы не работаете с внутренними исследованиями безопасности AI.

Claude автономно развивает исследования в области масштабируемого надзора

Новый результат исследований, опубликованный соруководителем команды по выравниванию Яном Лайке, подтверждает способность Claude к саморазвитию в критической области. Модель успешно применили для достижения полностью автономного прогресса в исследованиях масштабируемого надзора (scalable oversight), причём эффективность этого прогресса измерялась по восстановлению разрыва в производительности (PGR). Это означает, что Claude смог не просто воспроизвести существующие методы, но и развить их, улучшив ключевые метрики.

Интересен и экономический аспект этого эксперимента. Claude не только итерировал различные техники, но и смог превзойти по результатам человеческие команды исследователей, затратив на это эквивалент $18 тысяч в кредитах. Это подчёркивает не только техническую зрелость AI в решении сложных задач, но и его потенциал для снижения затрат на высокоинтеллектуальный труд.

Anthropic заявляет, что Claude показал способность к автономному прогрессу в исследованиях. Внутреннее исследование использовало Claude для итерации по различным методам, что привело к существенному превосходству над людьми-исследователями. Этот подход является ключевым шагом к более безопасным и надёжным AI-системам, позволяя автоматизировать сложные и трудоёмкие задачи контроля и валидации. Анонс

Что это значит

Это исследование показывает не просто эволюцию AI, но и его потенциал как активного исследователя, а не только инструмента. Способность Claude автономно развивать методы в области, столь критичной для безопасности будущих AI-систем, предполагает, что мы можем быть на пороге эры, где AI будет не только создавать, но и активно проверять, и улучшать самого себя, ускоряя прогресс в фундаментальных исследованиях и сокращая их стоимость.

Источники

  1. https://x.com/janleike/status/2044139528596910584 external