Для работы с новейшими AI-моделями Google не всегда нужно быть в Google Cloud. Платформа OpenRouter добавила Gemini 3.1 Flash-Lite, самую быструю и экономичную модель Gemini 3 серии, сделав её доступной без привязки к экосистеме Google.
Gemini 3.1 Flash-Lite — это модель, оптимизированная для высокой скорости и низкой стоимости при обработке больших объёмов запросов. Она создана для задач, где важны минимальная задержка и эффективное масштабирование.
Ключевая особенность Flash-Lite — её мультимодальный ввод. Модель способна обрабатывать входные данные в виде текста, изображений, видео, аудио и PDF-документов. При этом она выдаёт только текстовые ответы, не генерируя изображения или видео. Контекстное окно модели составляет до 1,048,576 токенов, что позволяет работать с очень большими объёмами информации.
Модель ориентирована на агентные задачи и автоматизированные рабочие процессы, где требуется высокая точность для вызова инструментов (tool calling) и оркестрации. Google отмечает улучшение качества ответов и следования инструкциям по сравнению с предыдущими моделями Flash-Lite, при этом производительность соответствует Gemini 2.5 Flash. Разработчики могут выбирать один из четырёх уровней «мышления» (minimal, low, medium, high), чтобы найти баланс между качеством ответа и скоростью.
Gemini 3.1 Flash-Lite поддерживает следующие возможности:
- Grounding с Google Search
- Выполнение кода
- Тонкая настройка (supervised fine-tuning, continuous tuning)
- Системные инструкции
- Вызов функций (function calling)
- Подсчёт токенов
- Структурированный вывод
- Кэширование контекста (implicit и explicit)
- Чат-комплешены
Интеграция Gemini 3.1 Flash-Lite в OpenRouter позволяет разработчикам использовать этот быстрый и экономичный мультимодальный движок для своих агентов, не привязываясь к экосистеме Google Cloud. Это расширяет выбор для тех, кому нужны высокая скорость и большой контекст, но только с текстовым выводом.