AI News Watcher
Monday, Jun 1, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 01, 2026 · 1 min read · HuggingFace ← Back to feed

Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков daily

Не замена GPT-4, а быстрый компонент внутри мультимодельной системы — роутер, RAG, суб-агент.

Hero illustration: Mellum2: JetBrains делает ставку на «фокальную» MoE-модель для AI-стеков.

Редакция · Daily briefing

JetBrains открыла Mellum2 — 12B MoE с активацией 2.5B параметров на токен — как специализированный блок для высокочастотных задач в агентных пайплайнах, где латентность важнее универсальности.

MoE-архитектура здесь — это конкретная инженерная ставка: 12B параметров хранятся в модели, но на каждый токен активируются только 2.5B. На практике это значит, что вывод ведёт себя как у dense-модели на 2.5B, а не на 12B. JetBrains заявляет более чем двукратное ускорение throughput по сравнению с open-моделями сопоставимого размера — цифра из собственного техотчёта. Мультимодальность намеренно выброшена: только text и code, чтобы не раздувать модель под задачи, которых здесь нет.

Целевые сценарии чётко ограничены и не пересекаются с тем, что делают frontier-модели:

На Hugging Face доступны пять вариантов: Base, Base-Pretrain, Instruct-SFT, Instruct и Thinking.

Mellum2 — попытка занять нишу «инфраструктурной» модели в многоуровневых AI-системах: не самой умной, но самой дешёвой в эксплуатации на высокочастотных вызовах. Честный пробел: JetBrains не даёт прямых сравнительных таблиц против конкретных конкурентов — Qwen2.5, Phi-4 MoE и других. Формулировка «competitive with similarly-sized models» в техотчёте на arXiv без поимённых цифр остаётся на доверии к авторам.

Источники

  1. https://huggingface.co/blog/JetBrains/mellum2-launch external
  2. https://huggingface.co/blog/ibm-research/agent-logic-and-scalable-ai-adoption external
  3. https://huggingface.co/papers?date=2026-06-01 external
  4. https://arxiv.org/abs/2605.29307 external
  5. https://arxiv.org/abs/2605.31264 external
  6. https://arxiv.org/abs/2605.31159 external
  7. https://arxiv.org/abs/2605.31604 external
  8. https://arxiv.org/abs/2605.30993 external
  9. https://arxiv.org/abs/2605.31268 external
  10. https://arxiv.org/abs/2605.31584 external
  11. https://arxiv.org/abs/2605.30819 external
  12. https://arxiv.org/abs/2605.31039 external
  13. https://arxiv.org/abs/2605.30940 external
  14. https://arxiv.org/abs/2605.30409 external
  15. https://arxiv.org/abs/2605.28618 external
  16. https://arxiv.org/abs/2605.31075 external
  17. https://arxiv.org/abs/2605.30876 external
  18. https://huggingface.co/blog/nvidia/cosmos-3-for-physical-ai external