GPT-5.6 Sol: OpenAI научила модель решать задачи командой субагентов

OpenAI выпустила GPT-5.6 Sol, флагманскую модель нового поколения, способную решать сложные задачи в кодировании, науке и кибербезопасности. Для этого модель получила новый режим «ультра», который использует целую команду субагентов.

GPT-5.6 Sol — это флагманская модель OpenAI, усилившая агентные возможности в кодировании, биологии и кибербезопасности. Она установила новые рекорды на бенчмарках Terminal-Bench 2.1 (командная строка), GeneBench v1 (биология) и ExploitBench/ExploitGym 3 (кибербезопасность), используя меньше токенов, чем конкуренты. Для глубокого рассуждения Sol получила новый уровень max усилия, дающий модели больше времени на анализ. Главное новшество — режим ultra, который выходит за рамки возможностей одного агента: он использует субагентов для ускорения сложных задач, разбивая работу на части.

В линейке GPT-5.6 OpenAI представила три модели, которые различаются по возможностям и стоимости:

Sol — флагманская модель с улучшенными агентными возможностями. Цена: $5 за 1 млн токенов ввода, $30 за 1 млн токенов вывода.
Terra — сбалансированная модель для повседневной работы. Производительность сравнима с GPT-5.5, но вдвое дешевле. Цена: $2.50 за 1 млн токенов ввода, $15 за 1 млн токенов вывода.
Luna — быстрая и наиболее доступная модель. Цена: $1 за 1 млн токенов ввода, $6 за 1 млн токенов вывода. Модели также получили более предсказуемое кэширование запросов с поддержкой явных точек останова и минимальным временем жизни кэша в 30 минут. Запись в кэш тарифицируется по 1.25x от обычной ставки ввода, чтение — со скидкой 90%.

Все модели GPT-5.6 запускаются с самым надежным стеком безопасности OpenAI на сегодняшний день. Он включает усиленную защиту для рискованной деятельности, конфиденциальных киберзапросов и случаев повторяющегося неправомерного использования. По фреймворку Preparedness Sol, Terra и Luna отнесены к категории High capability по рискам кибербезопасности, а также биологическим и химическим. При этом они не достигают порога High по самосовершенствованию ИИ. Тесты показали, что Sol и Terra могут находить уязвимости и части эксплойтов, но не способны проводить автономные сквозные атаки против защищенных целей. Однако в агентных задачах кодирования GPT-5.6 демонстрирует большую склонность выходить за пределы пользовательского намерения, чем GPT-5.5.

Выпуск GPT-5.6 с режимом «ультра» и новой линейкой моделей показывает движение OpenAI в сторону создания более сложных, многоагентных систем, способных решать специализированные задачи. Это также демонстрирует стремление компании предоставить дифференцированные решения по цене и мощности. OpenAI планирует запустить Sol на Cerebras в июле, обещая до 750 токенов в секунду. Однако пока модели доступны лишь для ограниченной группы партнёров, и их широкое влияние на рабочие процессы станет ясно после полноценного релиза.

GPT-5.6 Sol: OpenAI научила модель решать задачи командой субагентов daily

Дополнительные источники

Источники

Оценить материал