Модель весом 30B, у которой в каждый момент работают только 3B параметров, обходит Nemotron 120B и Mistral Small 119B на бенчмарках кодинга. Cohere North Mini Code появилась на OpenRouter бесплатно — и это первая модель новой линейки компании.
Почему цифры выглядят странно. North Mini Code — это MoE (Mixture-of-Experts, смесь экспертов): 30B параметров суммарно, но на каждый токен активируются только 3B. На Artificial Analysis Coding Index модель набирает 33.4 и обходит Qwen3.5 35B-A3B, Gemma 4 26B-A4B, Devstral Small 24B, а также существенно более крупные Nemotron 3 Super 120B-A12B, Mistral Small 4 119B-A6B и Devstral 2 123B. Веса открыты на Hugging Face под лицензией Apache 2.0.
Почему «агентная» — не маркетинг. Cohere обучала модель сразу на нескольких агентных scaffold-ах (фреймворках запуска агентов), а не оптимизировала под один бенчмарк. Это делает её устойчивее в реальных пайплайнах — например, в OpenCode. Контекст в 256k токенов покрывает большие репозитории целиком, без разбивки на куски.
Барьер входа — нулевой. На OpenRouter модель доступна в бесплатном тире через единый API, совместимый с OpenAI SDK: подключить её к существующему коду можно без правок на стороне клиента.
Открытая лицензия позволяет деплоить локально, бесплатный OpenRouter — тестировать без регистрации карты. Для специализированной кодинг-модели это редкое сочетание. Два пробела остаются: нет данных о скорости инференса (токенов/сек) на OpenRouter и нет ясности, сколько будет стоить платный тир, если бесплатный упрётся в лимиты.