«Бесплатный» API может исчезнуть за один вечер тестирования — или тихо обучать чужую модель на ваших данных. OpenRouter опубликовал сравнение 13 провайдеров бесплатного LLM-доступа: постоянные тиры, пробные кредиты и реальные ограничения в одной таблице.
Три категории «бесплатного» — и только одна пригодна для постоянной работы.
Слово «бесплатно» в контексте LLM API означает три разные вещи. Постоянные тиры (OpenRouter, Groq, Google AI Studio, Mistral, Cerebras) — без срока действия и без карты. Пробные кредиты от $1 до $30, у DeepSeek — 10 млн токенов — одноразовые и заканчиваются быстро. Локальный инференс через Ollama или vLLM не считает токены, но вы сами платите за железо и электричество.
Строить что-либо постоянное имеет смысл только на первой категории. Кредиты — для разовой оценки, не для прода.
У каждого постоянного тира своя специализация — и своя скрытая цена.
Провайдеры не конкурируют по одной шкале: у каждого узкое преимущество и конкретный компромисс.
- Groq — около 320 токенов/с на Llama 3.3 70B (данные Artificial Analysis), специализированное LPU-железо. Идеален для голосовых агентов и real-time чата. Данные на обучение не идут.
- Mistral (Experiment-тир) — ~1 млрд токенов в месяц, один из самых щедрых постоянных лимитов в списке. Условие: обязательный opt-in в обучение модели на ваших промптах.
- Google AI Studio — контекст до 1 млн токенов на Gemini Flash, мультимодальный ввод (текст, изображения, аудио). Промпты идут на обучение за пределами ЕС, UK и EEA — явная политика, не мелкий шрифт.
- Cerebras — около 1 млн токенов в день на Llama 3.3 70B, без компромисса по скорости. Подходит для батч-обработки: чистка данных, суммаризация, офлайн-задачи.
- OpenRouter — 20+ моделей по одному API-ключу, единый OpenAI-совместимый эндпоинт. Лимит: 50 запросов в день; при разовом пополнении на $10 поднимается до 1000. Данные на обучение не передаются.
Четыре скрытых стоимости, о которых не пишут в заголовках.
Бесплатный тир перекладывает затраты с кошелька на другие ресурсы. Четыре места, где это проявляется:
- Политика обучения на данных. Google использует промпты вне ЕС/UK/EEA. Mistral Experiment требует явного согласия. Если в запросах есть клиентские данные или проприетарный код — это уже compliance-риск.
- Урезанный контекст. Некоторые провайдеры дают меньшее окно контекста на бесплатном эндпоинте, чем на платном, — даже для той же модели. Длинные разговоры обрезаются, RAG-пайплайны теряют контекст.
- Квантизация весов. Часть платформ отдаёт на бесплатных тирах уменьшенные (квантованные, например 8-bit или 4-bit) версии модели вместо полноточных. На сложных задачах качество падает. OpenRouter указывает уровень квантизации для каждого эндпоинта.
- Отсутствие SLA. Лимиты могут ужесточиться без предупреждения. IP из дата-центров и shared-хостинга часто блокируются как потенциальный абьюз. Для клиентских сервисов это неприемлемый риск.
Сравнение написано OpenRouter — компанией, которая продаёт себя как универсальный роутер поверх всех этих провайдеров. Это не делает данные неверными, но угол подачи нужно учитывать. Честный пробел в таблице: нет данных о реальном uptime и задержках на бесплатных тирах в часы пик. Именно это — а не лимиты на бумаге — определяет, можно ли на них полагаться в продакшне.