MiniMax выпустил M3 — агентскую мультимодальную модель с окном 1M токенов, которая подключается как drop-in замена через Anthropic SDK, а в первые 7 дней стоит вдвое дешевле прайса.
Главный инженерный крючок — совместимость с Anthropic SDK без переписывания кода. Достаточно переставить две переменные окружения: ANTHROPIC_BASE_URL на `` и указать model="MiniMax-M3". Поддерживаются блоки thinking и tool_use, а в мультиходовых function call нужно сохранять полный response.content в историю — иначе reasoning chain рвётся.
Ценовая структура разбита по объёму входа:
- До 512k токенов — промо 7 дней: $0.30/$1.20 (in/out) за миллион; стандартная цена $0.60/$2.40.
- Свыше 512k токенов — $1.20/$4.80, доступ лимитирован, нужно обращаться в sales. Полный публичный релиз верхней половины окна ожидается «в ближайшие дни».
- Prompt caching read — $0.06/M по промо, $0.12/M по стандарту (только для ≤512k).
Настоящая история здесь не «новая модель», а то, что MiniMax встраивается в Anthropic-экосистему как ценовая альтернатива для длинного контекста. Честный пробел: вендор не опубликовал ни одного публичного бенчмарка по M3 — ни MMLU, ни SWE-bench, ни RULER. Чем M3 лучше M2.7 кроме большего окна и заявленного «агентского рассуждения» — из релиза непонятно.