AI News Watcher
Monday, Apr 6, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Apr 06, 2026 · 3 min read · Black Forest Labs ← Back to feed

AI-новости daily

**Обратите внимание на `pipe.enable_model_cpu_offload()`** — эта строка кода демонстрирует типичную технику для дальнейшей оптимизации использования VRAM, перемещая части модели в CPU по мере необходимости.

Hero illustration: AI-новости.

Редакция · Daily briefing

Обратите внимание на pipe.enable_model_cpu_offload() — эта строка кода демонстрирует типичную технику для дальнейшей оптимизации использования VRAM, перемещая части модели в CPU по мере необходимости.

Что важно знать

Ограничения модели. flux-2-small-decoder, как и многие генеративные модели, не предназначен для предоставления фактической информации. Генерируемый текст может быть неточным или искаженным. Модель может демонстрировать или усиливать смещения, присутствующие в обучающих данных, и может не всегда точно следовать промпту, так как этот аспект сильно зависит от стиля промптинга.

Что это значит

Для разработчиков, работающих с генерацией изображений, flux-2-small-decoder предлагает прямое улучшение производительности без необходимости радикально перестраивать существующие пайплайны. Экономия VRAM и ускорение декодирования могут оказаться критически важными для масштабирования проектов или работы на менее мощном оборудовании, открывая возможность экспериментировать с более высокими разрешениями и сложными сценариями использования FLUX.2.

Модели семейства FLUX.2 обеспечивают различные режимы работы, позволяя выбирать между скоростью, качеством и детализированным контролем. Например, модель FLUX.2 [klein] 4B оптимизирована для работы в реальном времени и высоких объемов запросов, в то время как FLUX.2 [max] ориентирована на наивысшее качество и возможности поиска с привязкой к контексту. Для сценариев, требующих воспроизводимости результатов, доступны фиксированные версии моделей, такие как /flux-2-pro, а для доступа к новейшим достижениям можно использовать preview-версии, например /flux-2-pro-preview. Отдельная модель FLUX.2 [flex] предназначена для тех, кому нужен тонкий контроль над типографикой и другими аспектами генерации.

Тарификация FLUX.2

Black Forest Labs использует кредитную систему для тарификации всех моделей FLUX, где 1 кредит эквивалентен $0.01 USD. Оплата взимается за каждое сгенерированное изображение, и цена одинакова как для использования через API, так и в Playground.

Модели FLUX.2 используют мегапиксельную тарификацию, что означает, что стоимость масштабируется в зависимости от выходного разрешения изображения. Так, генерация изображения через FLUX.2 [klein] 4B начинается от $0.014, а для FLUX.2 [max] цена составит от $0.07. Существуют также бесплатные варианты, например, FLUX.2 [dev] для локальной некоммерческой разработки. Для работы с пакетами изображений FLUX.2 [pro] стоимость пакета из 4 изображений составит от $0.12, при этом одно изображение стоит от $0.03.

Бета-версии тонко настроенных моделей FLUX.2 оплачиваются по тем же тарифам, что и их базовые аналоги. Например, запросы к flux-2-klein-9b-kv-finetuned стоят от $0.015, как и для flux-2-klein-9b при том же разрешении.

Доступ к API и лимиты

API Black Forest Labs предоставляет как глобальные, так и региональные конечные точки, что обеспечивает гибкость в развертывании. Глобальная конечная точка api.bfl.ai рекомендуется для большинства случаев, так как она автоматически распределяет запросы по доступным кластерам, обеспечивая повышенную отказоустойчивость и интеллектуальное распределение нагрузки. Для пользователей, которым важна локализация данных, доступны региональные конечные точки, такие как api.eu.bfl.ai для европейских регионов (соответствует GDPR) и api.us.bfl.ai для американских.

API работает в асинхронном режиме: сначала отправляется запрос на генерацию, а затем опрашивается статус для получения результата. Действуют ограничения на количество активных задач: большинство моделей ограничиваются 24 активными задачами, однако для flux-kontext-max лимит составляет 6 активных задач. При превышении лимита возвращается статус-код 429.


Ссылки:

Документация

Источники

  1. https://huggingface.co/black-forest-labs/FLUX.2-small-decoder docs