1 июня 2026 г. Google отключила четыре модели Gemini 2.0 Flash в Gemini API — любой вызов к этим эндпоинтам теперь падает, и нужна явная миграция. Примечательно здесь не само отключение, а то, куда ведут замены: не в 2.5, а сразу в 3.x.
Отключены четыре модели, для каждой есть конкретная замена:
- gemini-2.0-flash и gemini-2.0-flash-001 →
gemini-3.5-flash(Stable) - gemini-2.0-flash-lite и gemini-2.0-flash-lite-001 →
gemini-3.1-flash-lite(Stable)
gemini-3.1-flash-lite — мультимодальная модель с входами текст, изображение, видео, аудио и PDF. Контекстное окно — 1M токенов, лимит вывода — 65 536 токенов. Из возможностей: function calling, structured outputs, caching, batch API, search grounding, thinking и URL context. По документации ориентирована на высокочастотные агентные пайплайны и массовую обработку — переводы, тикеты, извлечение данных — где стоимость и латентность важнее глубины рассуждений.
Google фактически пропустила публичный мажорный переход 2.x→3.x для Flash-сегмента: пользователи 2.0 Flash оказались сразу на 3.5/3.1, минуя промежуточные версии. При этом сравнительных бенчмарков качества и цены Google не опубликовала — неясно, получают ли пользователи улучшение или просто вынуждены мигрировать.