AI News Watcher
Tuesday, Jun 30, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 30, 2026 · 1 min read · ElevenLabs ← Back to feed

Google выпустила Gemini Omni Flash и Nano Banana 2 Lite: правят видео и фото по тексту — и это дешевле daily

Две модели для видео и фото — одна в превью, другая доступна сразу. Обе работают через Interactions API, оптимизированный под агентные задачи.

Google выпустила Gemini Omni Flash и Nano Banana 2 Lite: правят видео и фото по тексту — и это дешевле
Редакция · Daily briefing

Сложный монтаж видео и многоступенчатая ретушь фото обычно требуют специализированных инструментов и навыков. Google упрощает эти задачи, представив две новые мультимодальные модели — Gemini Omni Flash и Nano Banana 2 Lite — которые управляются текстовыми командами через новый API.

Google представила Gemini Omni Flash для видео и Nano Banana 2 Lite для изображений. Эти модели позволяют редактировать медиаконтент, используя текстовые запросы, и, по заявлению компании, обеспечивают одно из лучших соотношений цены и производительности среди решений на рынке.

Ключевую роль в этих возможностях играет Interactions API, который теперь общедоступен. Google рекомендует его для всех новых проектов, поскольку он оптимизирован под агентные рабочие процессы и управление состоянием моделей. Руководитель отдела по работе с разработчиками Торстен Шефф уже продемонстрировал возможности API для многоэтапного редактирования изображений.

Gemini Omni Flash (в статусе публичного превью) предназначен для быстрой генерации и диалогового редактирования видео. Модель позволяет менять персонажей, объекты, освещение или стили сцен по текстовому запросу. Она принимает на вход текст, изображения и видео до 10 секунд для редактирования, а выдаёт готовое видео длиной 3–10 секунд в разрешении 720p при 24 FPS. Контекстное окно модели составляет 1 048 576 токенов.

Nano Banana 2 Lite (общедоступна) — это самая быстрая и экономичная модель для генерации и редактирования изображений в семействе Nano Banana. Она ориентирована на быстрое прототипирование, A/B-тестирование рекламных креативов и масштабирование для социальных приложений.

Эти релизы ясно показывают курс Google на упрощение сложных мультимодальных задач и интеграцию разговорного ИИ в творческие рабочие процессы. Однако, пока Gemini Omni Flash находится в статусе превью, инженерам предстоит оценить его реальную производительность и стабильность в продакшене.

Дополнительные источники

  1. Gemini API Documentation
  2. Bringing speed and strong cost performance to the market with Gemini Omni Flash and Nano Banana 2 Lite
  3. Gemini Omni Flash Documentation
  4. openai.com
  5. lmstudio.ai

Источники

  1. https://x.com/thorwebdev/status/2071791688105009561 external
  2. https://x.com/thorwebdev/status/2071996091869057175 external
  3. https://x.com/thorwebdev/status/2072001722176979115 external
  4. http://ai.dev/banana unknown
  5. https://x.com/thorwebdev/status/2072026270133788805 external
  6. https://x.com/thorwebdev/status/2072036080162103342 external
  7. https://x.com/thorwebdev/status/2072067085304480219 external
  8. https://x.com/thorwebdev/status/2072121664343822467 external
  9. https://ai.google.dev/gemini-api/docs/image-generation#multi-turn-image-editing unknown
→ Опубликовано в Telegram: @agentic_ai_news/610