AI News Watcher
Thursday, Apr 2, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Apr 02, 2026 · 4 min read · Google ← Back to feed

Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5 daily

Google выпустил Gemma 4 — открытые модели под лицензией Apache 2.0, которые можно скачать и держать на своём железе. На отраслевом open-leaderboard Arena AI text они встали на 3-е и 6-е места среди всех открытых моделей мира, обходя те, что в 20 раз крупнее.

Hero illustration: Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5.

Редакция · Daily briefing

А в том же окне, тихо одной строкой в release notes, Google назначил дату вывода своему же платному середняку — Gemini 2.5. Каждый жест по отдельности — рутина. Вместе они читаются как сообщение о том, куда вас подталкивают.

Стоит читать если: гоняете Gemini 2.5 в продакшене или присматриваетесь к self-hosted / edge-модели под свои данные. Можно пропустить если: не используете модели Google и не планируете open-weights.

Что за модель и почему о ней говорят

Те места в рейтинге — не случайность и не маркетинговая формулировка. Gemma 4 построена на той же исследовательской базе, что закрытая Gemini 3, и опирается на большой задел: первые поколения Gemma скачали свыше 400 млн раз, вокруг них выросло больше 100 000 производных моделей. Этот опыт и лёг в четвёртую версию — отсюда и результат на лидерборде.

Четыре размера под разное железо:

Что именно выпущено: gemma-4-26b-a4b-it и gemma-4-31b-it — в AI Studio и через Gemini API; 26B также добавлена в Vertex AI Model Garden как managed API.

Что она умеет

Где это запускается — в этом и весь смысл

Открытые веса интересны не сами по себе, а тем, где их можно запускать без облака. Главное здесь — диапазон: одна и та же линейка тянется от телефона до серверной видеокарты.

На практике это база для дообучения, а не чат общего назначения. Видно по двум примерам: на Gemma собрали болгарско-ориентированную модель BgGPT, а вместе с Йельским университетом — систему для поиска новых путей терапии рака.

Тихая часть: дедлайн на Gemini 2.5

Та самая строка из вступления — теперь конкретно. Gemini 2.5 Pro, Gemini 2.5 Flash-Lite и Gemini 2.5 Flash выводятся из эксплуатации 16 октября 2026 года — около полугода на миграцию.

Контекст из changelog: gemini-2.5-flash-lite-preview-09-2025 уже отключён (замена — gemini-3.1-flash-lite-preview), а 1 апреля введены inference-тиры Flex и Priority — рычаг «стоимость или задержка» на время перехода.

Вывод 2.5 и одновременный выход бесплатной Gemma 4 — согласованный сигнал: Google предпочитает, чтобы вы перешли на линейку Gemini 3 либо взяли self-hosted Gemma, а не оставались на 2.5.

Veo 3.1 Lite — коротко и честно

Две фразы, потому что в источниках больше ничего нет: veo-3.1-lite-generate-preview доступна в public preview, заявлена как самая экономичная модель Veo, под быстрые итерации и высоконагруженные приложения. Спецификаций, цен и лимитов на эту дату нет — додумывать не будем. Release notes Vertex AI.

Что это значит

«Интеллект на параметр» плюс Apache 2.0 меняет арифметику build-vs-rent для команд с требованиями к резидентности данных: 31B Dense держится на одной H100 и дообучается под задачу.

Сложите это с зафиксированным дедлайном на Gemini 2.5 — и рациональный шаг не «мигрировать в октябре», а уже сейчас прогнать Gemma 4 31B как кандидата в fine-tune-базу против Gemini 3 на своей задаче, пока есть запас по времени.

Источники

  1. https://docs.cloud.google.com/vertex-ai/generative-ai/docs/release-notes#April_02_2026 docs
  2. https://ai.google.dev/gemini-api/docs/changelog#04-02-2026 docs
  3. https://deepmind.google/blog/gemma-4-byte-for-byte-the-most-capable-open-models/ blog