Стоит читать если: вы используете модели MiniMax или интересуетесь возможностями самообучающихся агентов в инженерных и профессиональных задачах. Можно пропустить если: вам не нужна глубина по конкретным моделям MiniMax, и вы ищете только общую сводку новостей.
Самостоятельная эволюция: как это работает
MiniMax-M2.7 запускает цикл собственной эволюции. В процессе разработки модель обновляет собственную память, создает десятки сложных навыков для экспериментов с обучением с подкреплением (RL) и улучшает свой процесс обучения на основе результатов этих экспериментов. Внутренняя версия модели показала 30% улучшение производительности, автономно оптимизируя программный каркас более чем в 100 итерациях — анализируя траектории отказов, изменяя код, проводя оценки и решая, сохранять изменения или отменять. На MLE Bench Lite, состоящем из 22 соревнований по машинному обучению, M2.7 достигла 66.6% медалей, уступив лишь Opus-4.6 и GPT-5.4. Этот подход к самооптимизации может изменить парадигму разработки AI-систем.
Профессиональная разработка ПО
Модель демонстрирует свои возможности в реальной разработке программного обеспечения. Это включает анализ логов, устранение ошибок, рефакторинг, обеспечение безопасности кода и задачи машинного обучения. M2.7 проявляет сильные способности к системному мышлению, коррелируя метрики мониторинга, проводя трассировочный анализ, проверяя первопричины в базах данных и принимая решения на уровне инженера по надежности сайта (SRE). Использование M2.7 помогло сократить время восстановления после инцидентов в продакшене до менее чем трех минут в нескольких случаях. В бенчмарке SWE-Pro модель достигла 56.22%, что соответствует GPT-5.3-Codex. Еще более высокие результаты показаны в бенчмарках реального мира: SWE Multilingual (76.5) и Multi SWE Bench (52.7). На VIBE-Pro (55.6%) M2.7 почти сравнялась с Opus 4.6, а также демонстрирует глубокое понимание сложных инженерных систем на Terminal Bench 2 (57.0%) и NL2Repo (39.8%). Модель поддерживает нативные команды агентов (Agent Teams) для многоагентного взаимодействия со стабильной ролевой идентичностью и автономным принятием решений.
Профессиональные задачи и развлечения
В сфере профессиональной работы M2.7 также показывает высокие результаты. Модель достигла ELO-рейтинга 1495 на GDPval-AA, что является самым высоким показателем среди открытых моделей и превосходит GPT5.3. M2.7 способна работать с документами Word, Excel и PowerPoint, выполняя многораундовое редактирование с высокой точностью и создавая редактируемые результаты. На Toolathon модель достигла 46.3% точности (что является одним из лучших результатов в мире) и поддерживает 97% соответствия навыкам по более чем 40 сложным навыкам на MM Claw. В сквозном бенчмарке MM Claw M2.7 получила 62.7%, приближаясь к Sonnet 4.6.
В области развлечений M2.7 предлагает улучшенную согласованность персонажей и эмоциональный интеллект. MiniMax также открыла исходный код OpenRoom — интерактивной демонстрации, которая помещает взаимодействие с ИИ в веб-интерфейс с визуальной обратной связью в реальном времени и взаимодействием со сценой.
Как использовать и развернуть модель
Модель MiniMax-M2.7 доступна для скачивания на Hugging Face. Ее размер составляет 229 миллиардов параметров, с поддержкой типов тензоров F32, BF16 и F8_E4M3. Для локального развертывания MiniMax рекомендует использовать следующие фреймворки вывода (в алфавитном порядке): SGLang, vLLM, Transformers. Также веса модели можно получить из ModelScope. MiniMax M2.7 также доступна на NVIDIA NIM Endpoint.
Рекомендуемые параметры вывода для достижения наилучшей производительности: temperature=1.0, top_p=0.95, top_k=40. Системный промпт по умолчанию: You are a helpful assistant. Your name is MiniMax-M2.7 and is built by MiniMax.
Что это значит
Выход MiniMax-M2.7 демонстрирует новый вектор развития моделей, где фокус смещается на автономию и самооптимизацию. Это может ускорить разработку и улучшение AI-систем, позволяя им самостоятельно адаптироваться и повышать свою эффективность в сложных инженерных задачах. Для инженеров это означает потенциально более мощные и гибкие инструменты, способные сократить рутинные операции и повысить скорость решения проблем на продакшене.