<НА ГЛАВНУЮ

Black Forest Labs Запускает FLUX.2 [klein] Модели

Представляем FLUX.2 [klein] — семейство компактных моделей для интерактивного визуального интеллекта на потребительском оборудовании.

Компактные Модели для Потребительского Оборудования

Black Forest Labs выпустила FLUX.2 [klein], компактную семью моделей изображений, ориентированных на интерактивный визуальный интеллект на потребительском оборудовании. FLUX.2 [klein] расширяет линейку FLUX.2 с генерацией и редактированием менее чем за секунду, единой архитектурой для текста в изображение и изображения в изображение, а также вариантами развертывания от локальных GPU до облачных API, при этом сохраняя качество изображений на передовом уровне.

От FLUX.2 [dev] к интерактивному визуальному интеллекту

FLUX.2 [dev] — это 32-миллиардная параметрическая исправленная потоковая трансформаторная модель для генерации и редактирования изображений на основе текста, способная составлять композиции с несколькими эталонными изображениями, в основном работающая на ускорителях класса дата-центров. Она настроена для максимального качества и гибкости, с длительными графиками выборки и высокими требованиями к VRAM.

FLUX.2 [klein] использует ту же концепцию дизайна и сжимает ее в более компактные исправленные потоковые трансформаторы с 4 миллиардами и 9 миллиардами параметров. Эти модели дистиллируются до очень коротких графиков выборки, поддерживают те же задачи генерации и редактирования изображения по тексту и многоссылочным задачам и оптимизированы для времени отклика менее 1 секунды на современных GPU.

Семья Моделей и Возможности

Семья FLUX.2 [klein] состоит из четырех основных открытых весовых вариантов в одной архитектуре:

  • FLUX.2 [klein] 4B
  • FLUX.2 [klein] 9B
  • FLUX.2 [klein] 4B Base
  • FLUX.2 [klein] 9B Base

FLUX.2 [klein] 4B и 9B — это модели с шаговой дистилляцией, использующие четыре шага вывода, предоставляя самые быстрые варианты для производства и интерактивных рабочих нагрузок. FLUX.2 [klein] 9B сочетает 9B потоковую модель с 8B текстовым встраивателем Qwen3 и описывается как флагманская небольшая модель на Пaretо-фронте по качеству и задержке для текстов в изображения, редактирования с одним эталоном и многоссылочной генерации.

Базовые варианты — это недистиллированные версии с более длительными графиками выборки, сохраняющие полный сигнал обучения и обеспечивающие более высокое разнообразие выходных данных. Они предназначены для дообучения, LoRA тренировки, научных процессов и пользовательских потоков постобучения, где контроль важнее, чем минимальная задержка.

Все модели FLUX.2 [klein] построены на одной архитектуре и поддерживают три основные задачи: генерировать изображения из текста, редактировать одно входное изображение и выполнять многоссылочную генерацию и редактирование, когда несколько входных изображений и подсказка совместно определяют целевой выход.

Задержка, VRAM и Квантизированные Варианты

Карта модели FLUX.2 [klein] предоставляет приблизительное время вывода от начала до конца на GB200 и RTX 5090. FLUX.2 [klein] 4B является самой быстрой моделью, с временем вывода от 0.3 до 1.2 секунд на изображение, в то время как FLUX.2 [klein] 9B нацелена на 0.5-2 секунды при более высоком качестве. Базовые модели имеют более длительные графики выборки, требуя несколько секунд, но предлагая гибкость для пользовательских процессов.

FLUX.2 [klein] 4B занимает примерно 13 ГБ VRAM и подходит для GPU, таких как RTX 3090 и RTX 4070. FLUX.2 [klein] 9B требует около 29 ГБ VRAM и нацеливается на оборудование, такое как RTX 4090, что означает, что одна высококлассная потребительская карта может размещать дистиллированные варианты с полным разрешением выборки.

Чтобы расширить совместимость с более широким спектром устройств, Black Forest Labs также выпустила версии FP8 и NVFP4 для всех вариантов FLUX.2 [klein], разработанные совместно с NVIDIA. Квантизация FP8 дает возможность увеличения скорости до 1.6 раз и уменьшения VRAM на 40%, в то время как NVFP4 предоставляет увеличение скорости до 2.7 раз и уменьшение VRAM на 55% для RTX GPU при сохранении основных возможностей.

Бенчмаркинг Против Других Моделей Изображений

Black Forest Labs оценивает FLUX.2 [klein] с помощью сравнений в стиле Эло для задач текст-в-изображение, редактирования с одним эталоном и многоссылочным задачам. Источники производительности ставят FLUX.2 [klein] на Пaretо-фронт по соотношению Эло-очков к задержке и VRAM. Комментарий показывает, что FLUX.2 [klein] соответствует или превосходит качество моделей изображений на основе Qwen при значительно меньшей задержке и VRAM, превосходя Z Image, поддерживая единую архитектуру для текстов в изображения и многоссылочного редактирования.

Ключевые Выводы

  • FLUX.2 [klein] является компактной моделью исправленного потокового трансформатора с вариантами 4B и 9B, поддерживающей генерацию изображений по тексту, редактирование одного изображения и многоссылочную генерацию в одной единой архитектуре.
  • Дистиллированные модели FLUX.2 [klein] 4B и 9B используют четыре шага выборки, оптимизированные для получения выходных данных менее чем за секунду на современных GPU, в то время как недистиллированные Базовые модели используют более длительные графики выборки, предназначенные для дообучения и научной работы.
  • Квантизированные варианты FP8 и NVFP4, разработанные с NVIDIA, обеспечивают увеличение скорости до 1.6 раз и сокращение VRAM примерно на 40% для FP8 и до 2.7 раз и 55% для NVFP4 на RTX GPU.
🇬🇧

Switch Language

Read this article in English

Switch to English