MiniMax-M3: 1M-контекст через Anthropic SDK за $0.30/M токенов

MiniMax-M3: 1M-контекст через Anthropic SDK за $0.30/M токенов daily

Верхняя граница в 512k — пока лимитированный доступ, публичный релиз обещан «через несколько дней».

Hero illustration: MiniMax-M3: 1M-контекст через Anthropic SDK за $0.30/M токенов.

MiniMax выпустил M3 — агентскую мультимодальную модель с окном 1M токенов, которая подключается как drop-in замена через Anthropic SDK, а в первые 7 дней стоит вдвое дешевле прайса.

Главный инженерный крючок — совместимость с Anthropic SDK без переписывания кода. Достаточно переставить две переменные окружения: ANTHROPIC_BASE_URL на `` и указать model="MiniMax-M3". Поддерживаются блоки thinking и tool_use, а в мультиходовых function call нужно сохранять полный response.content в историю — иначе reasoning chain рвётся.

Ценовая структура разбита по объёму входа:

До 512k токенов — промо 7 дней: $0.30/$1.20 (in/out) за миллион; стандартная цена $0.60/$2.40.
Свыше 512k токенов — $1.20/$4.80, доступ лимитирован, нужно обращаться в sales. Полный публичный релиз верхней половины окна ожидается «в ближайшие дни».
Prompt caching read — $0.06/M по промо, $0.12/M по стандарту (только для ≤512k).

Настоящая история здесь не «новая модель», а то, что MiniMax встраивается в Anthropic-экосистему как ценовая альтернатива для длинного контекста. Честный пробел: вендор не опубликовал ни одного публичного бенчмарка по M3 — ни MMLU, ни SWE-bench, ни RULER. Чем M3 лучше M2.7 кроме большего окна и заявленного «агентского рассуждения» — из релиза непонятно.

Основная статья

Дополнительные источники

MiniMax-M3: 1M-контекст через Anthropic SDK за $0.30/M токенов daily

Основная статья

Дополнительные источники

Оценить материал