FLUX.2 Klein

FLUX.2 Klein — generación de imágenes en menos de un segundo en GPUs de Clore.ai

FLUX.2 Klein de Black Forest Labs es el sucesor de FLUX.1, ofreciendo la misma calidad de imagen a 20–60× la velocidad. Donde FLUX.1 tardaba 10–30 segundos por imagen, FLUX.2 Klein genera en menos de 0.5 segundos en una RTX 4090. Es un modelo Diffusion Transformer (DiT) de 32B con licencia Apache 2.0, y desde enero de 2026, incluso tiene soporte experimental en Ollama.

Características clave

  • < 0.5 segundos de generación: 20–60× más rápido que FLUX.1

  • Arquitectura DiT de 32B: Misma calidad que FLUX.1 dev

  • Licencia Apache 2.0: Uso comercial completo

  • Soporte Ollama: Generación experimental de imágenes vía Ollama (ene 2026)

  • Compatible con ComfyUI: Reemplazo directo para flujos de trabajo de FLUX.1

  • LoRA + ControlNet: Adaptadores comunitarios disponibles

Requisitos

Componente
Mínimo
Recomendado

GPU

RTX 3090 24GB

RTX 4090 24GB

VRAM

16GB (con descarga a CPU)

24GB

RAM

32GB

64GB

Disco

40GB

60GB

CUDA

12.0+

12.1+

GPU recomendada de Clore.ai: RTX 4090 24GB (~$0.5–2/día) — generación subsegundo

Comparación de velocidad: FLUX.1 vs FLUX.2 Klein

GPU
FLUX.1 dev (20 pasos)
FLUX.2 Klein
Aceleración

RTX 3090

~25 s

~1.2 seg

20×

RTX 4090

~12 seg

~0.4 seg

30×

RTX 5090

~8 seg

~0.25 seg

32×

H100

~5 seg

~0.15 seg

33×

Inicio rápido con diffusers

Modo de memoria eficiente (GPUs de 16GB)

Flujo de trabajo en ComfyUI

FLUX.2 Klein funciona como reemplazo directo en flujos de trabajo existentes de FLUX.1 en ComfyUI:

  1. Descarga el checkpoint de FLUX.2 Klein a ComfyUI/models/diffusion_models/

  2. En tu flujo de trabajo, cambia el nodo de checkpoint para que apunte a FLUX.2 Klein

  3. Reduce los pasos a 4 (en lugar de 20–50 para FLUX.1)

  4. Establece la escala de guidance a 3.0–4.0

Generación por lotes

Con generación subsegundo, FLUX.2 Klein permite procesamiento masivo por lotes:

Soporte LoRA

Consejos para usuarios de Clore.ai

  • Rey del procesamiento por lotes: A 0.4 seg/imagen, puedes generar más de 10,000 imágenes por hora en RTX 4090

  • Solo 4 pasos: No uses más — Klein está optimizado para 4 pasos (más no mejora la calidad)

  • Mismas LoRAs que FLUX.1: La mayoría de LoRAs de FLUX.1 son compatibles con Klein

  • Reemplazo directo en ComfyUI: Simplemente cambia el checkpoint, cambia los pasos a 4

  • RTX 3090 es viable: 1.2 seg/imagen sigue siendo excelente a $0.3/día

Solución de problemas

Problema
Solución

OOM en 24GB

Usa enable_model_cpu_offload() + vae.enable_tiling()

Imágenes borrosas

Asegúrate de num_inference_steps=4, no menos. Verifica guidance_scale 3.0–4.0

Primera generación lenta

Normal — el modelo se carga en la primera llamada (~30s). Posteriores: subsegundo

Error de checkpoint en ComfyUI

Asegúrate de tener el .safetensors archivo, no el formato diffusers

Lecturas adicionales

Última actualización

¿Te fue útil?