Anthropic выпустил Claude Opus 4.8

О чём эта новость

Claude Opus 4.8 предлагает повышенную надежность и суждение, став рекомендуемой моделью для повседневного использования.подробнее →
Модель демонстрирует ** улучшения в кодировании**, с ростом на 4.9 пункта в бенчмарке SWE-bench Pro.подробнее →
В Claude Code появились «динамические рабочие процессы» для многоэтапных задач и «контроль усилий» для настройки поведения модели.подробнее →
Anthropic привлекла $65 млрд инвестиций в раунде Серии H, что увеличило оценку компании до $965 млрд.подробнее →

Anthropic одновременно представила несколько значимых анонсов: обновленную флагманскую модель Claude Opus 4.8 с заметными улучшениями и новыми функциями, а также объявила о привлечении $65 млрд в рамках раунда финансирования Серии H. Это финансирование увеличило оценку компании до почти $1 трлн, что подчеркивает растущую важность Anthropic на рынке искусственного интеллекта. Майк Кригер, директор по продуктам Anthropic, отметил, что Claude Opus 4.8 уже стала его основной моделью для повседневных задач, благодаря своей надежности и способности к более естественному взаимодействию.

Обновление Claude Opus 4.8: Общие улучшения

Anthropic выпустила новую версию своей флагманской модели — Claude Opus 4.8, которая позиционируется как более эффективный инструмент для совместной работы и повседневного использования. Алекс Альберт, руководитель отдела по связям с разработчиками, подтвердил, что в 4.8 было внесено множество исправлений на основе отзывов о предыдущей версии 4.7. Однако конкретные детали этих исправлений в источниках не раскрываются, оставляя за кадром, какие именно аспекты модели были улучшены.

Согласно заявлениям сотрудников Anthropic, Opus 4.8 демонстрирует повышенную надежность и улучшенное суждение. Майк Кригер, директор по продуктам, отметил, что модель стала «честнее» в своей работе, способна сообщать о неопределенности и самостоятельно выявлять недостатки в собственном коде до выдачи окончательного результата. Кэт Ву, руководитель отдела продуктов Claude Code, также подчеркнула, что Opus 4.8 «заметно честнее», признавая свои пробелы в знаниях и указывая на проблемы в своем коде, вместо того чтобы их игнорировать.

Claude Opus 4.8 рекомендуется для ежедневного использования в Claude Code. Разработчики отмечают, что модель лучше понимает нюансы, с ней стало намного естественнее общаться, и она стала более сильным помощником в широком спектре задач — от кодирования до работы со знаниями. В ходе раннего тестирования Opus 4.8 продемонстрировала более высокое суждение в агентских задачах, задавая правильные вопросы, исправляя собственные ошибки и отказываясь от выполнения нелогичных планов. На практике для повышения доверия к работе модели, несмотря на отсутствие конкретных метрик ее «честности», необходимо внимательно отслеживать ее производительность в реальных сценариях.

Улучшения в кодировании и снижение стоимости

Anthropic существенно улучшила возможности Claude Opus 4.8 в области кодирования, что делает ее самой сильной кодирующей моделью компании на сегодняшний день. Борис Черный, руководитель инженерной группы Claude Code, сообщил о заметном росте производительности модели в бенчмарке SWE-bench Pro — показатель улучшился с 64.3 до 69.2. Бенчмарк SWE-bench Pro предназначен для оценки способностей ИИ-агентов в сложных, многоэтапных задачах программной инженерии, охватывающих полный спектр профессиональной разработки программного обеспечения и работу с большими кодовыми базами. Это улучшение подчеркивает способность Opus 4.8 самостоятельно находить и исправлять ошибки, а также проявлять осторожность в неопределенных ситуациях.

Помимо повышения производительности, стоимость использования быстрого режима Opus 4.8 была снижена. Алекс Альберт подтвердил, что быстрый режим теперь стал намного доступнее, что меняет подход к использованию Claude Code. Модель в быстром режиме работает в 2.5 раза быстрее и теперь в три раза дешевле по сравнению с предыдущими версиями. Это изменение позволяет использовать быстрый режим для интерактивных задач, где требуются немедленные ответы, тогда как обычный режим остаётся предпочтительным для более длительных асинхронных операций, не требующих мгновенного результата. Несмотря на улучшения, цена стандартного использования Opus 4.8 осталась такой же, как у версии 4.7.

Динамические рабочие процессы и контроль усилий

Claude Code представил новую функцию — «динамические рабочие процессы», призванную упростить выполнение сложных многоэтапных задач. Как объясняет Кэт Ву, при упоминании слова «workflow» (рабочий процесс) в промпте, Claude динамически создает план оркестрации, которому строго следует. Это позволяет пользователям быть уверенными, что каждый этап задачи будет выполнен в правильном порядке, даже если задействованы сотни агентов. Ной Цвебен, менеджер по продуктам Claude Code, назвал эту функцию одной из самых полезных и невероятных из выпущенных, предрекая ей большое будущее.

Пользователи платформы claude.ai теперь получили возможность управлять «усилиями» модели при выполнении задач. Эта новая функция позволяет настроить «глубину мышления» Claude Opus 4.8, давая пользователям больше контроля над поведением модели. Алекс Альберт отметил, что команда приложила много усилий для калибровки этого параметра. Пользователям предлагается сообщать о случаях, когда модель «переусердствует» или «недодумывает», что указывает на продолжающуюся тонкую настройку.

Хотя Anthropic заявляет о возможностях динамических рабочих процессов, в источниках отсутствует детальное сравнение этой функции с аналогичными инструментами конкурентов, например, с Agent Engine от Google Vertex AI, который также предлагает решения для создания и управления многоагентными системами. Для реализации такого масштаба на практике потребуются тщательная настройка промптов и надежная интеграция с внешними системами.

Серия H: $65 млрд инвестиций и оценка почти в $1 трлн

Anthropic объявила о привлечении $65 млрд в рамках раунда финансирования Серии H, что стало одним из крупнейших инвестиционных событий в истории искусственного интеллекта. Этот раунд увеличил оценку компании до ошеломляющих $965 млрд после инвестиций, что, по данным Crunchbase, позволило Anthropic превзойти по оценке своего главного конкурента, OpenAI, которая ранее привлекла $110 млрд при оценке в $840 млрд.

Финансирование возглавили инвестиционные фонды: Altimeter Capital, Dragoneer, Greenoaks и Sequoia Capital. В число со-лидеров раунда также вошли Capital Group, Coatue, D1 Capital Partners, GIC, ICONIQ и XN. Среди других инвесторов были AMP PBC, Baillie Gifford, Blackstone, Brookfield, D.E. Shaw Ventures, DST Global, Fidelity Management & Research Company, General Catalyst, Insight Partners, Jane Street, Lightspeed Venture Partners, MGX, NTTVC, NX1 Capital, Situational Awareness LP, T. Rowe Price Associates, Inc., T. Rowe Price Investment Management, Inc. И Temasek.

Этот раунд также включает $15 млрд ранее обещанных инвестиций от гиперскейлеров, включая $5 млрд от Amazon, которая также участвовала в последнем раунде финансирования OpenAI. Привлеченные средства подчеркивают стремительный рост Anthropic; только за три месяца до этого компания привлекла $30 млрд в раунде Серии G при оценке в $380 млрд. Общая сумма привлеченных средств с момента основания компании в 2021 году достигла почти $144 млрд. Krishna Rao, финансовый директор Anthropic, отметил, что ежегодная выручка компании уже превысила $47 млрд.

Стратегическое значение и планы по расширению

Привлеченные $65 млрд инвестиций станут катализатором для стратегического развития Anthropic по нескольким ключевым направлениям. Как заявили в компании, эти средства будут направлены на продвижение исследований в области безопасности и интерпретируемости ИИ, расширение вычислительных мощностей для удовлетворения растущего спроса на Claude, а также масштабирование продуктов и партнерств, на которые полагаются клиенты. Сэм Боумен, руководитель исследования в области выравнивания и оценки, выразил особую заинтересованность в использовании ИИ-систем для повышения прозрачности и координации.

Anthropic планирует расширить свои вычислительные мощности за счет стратегических партнерств. Были подписаны соглашения с Amazon на предоставление до пяти гигаватт новой мощности, с Google и Broadcom на пять гигаватт мощностей TPU следующего поколения, а также со SpaceX на доступ к мощностям GPU в Colossus 1 и Colossus 2. Krishna Rao подчеркнул, что это финансирование поможет компании обслуживать исторический спрос, оставаться на переднем крае исследований и внедрять Claude там, где происходит работа. AWS остается основным облачным провайдером и партнером по обучению для Anthropic.

Это масштабное финансирование укрепит конкурентную позицию Anthropic на глобальном рынке ИИ. Брэд Герстнер, основатель и генеральный директор Altimeter Capital, считает, что такой импульс позволит Anthropic возглавить следующую фазу инноваций в области ИИ. Claude уже является первой моделью, доступной на всех трех крупнейших облачных платформах мира: Amazon Web Services, Google Cloud и Microsoft Azure. Однако детали конкретных исследовательских программ и измеримых целей масштабирования остаются в источниках неуточненными, что оставляет открытым вопрос о том, как именно компания будет использовать эти огромные инвестиции для достижения своих амбициозных целей.

Что это значит

Модель Claude Opus 4.8 получила улучшения в кодировании и «динамические рабочие процессы», а компания привлекла $65 млрд инвестиций. Насколько это поможет ей опередить конкурентов в гонке технологий, покажут ближайшие годы.

Anthropic выпустил Claude Opus 4.8 daily