# FLUX.2 Klein

FLUX.2 Klein de Black Forest Labs es el sucesor de FLUX.1, ofreciendo la misma calidad de imagen a **20–60× la velocidad**. Donde FLUX.1 tardaba 10–30 segundos por imagen, FLUX.2 Klein genera en **menos de 0.5 segundos** en una RTX 4090. Es un modelo Diffusion Transformer (DiT) de 32B con licencia Apache 2.0, y desde enero de 2026, incluso tiene soporte experimental en Ollama.

## Características clave

* **< 0.5 segundos de generación**: 20–60× más rápido que FLUX.1
* **Arquitectura DiT de 32B**: Misma calidad que FLUX.1 dev
* **Licencia Apache 2.0**: Uso comercial completo
* **Soporte Ollama**: Generación experimental de imágenes vía Ollama (ene 2026)
* **Compatible con ComfyUI**: Reemplazo directo para flujos de trabajo de FLUX.1
* **LoRA + ControlNet**: Adaptadores comunitarios disponibles

## Requisitos

| Componente | Mínimo                    | Recomendado   |
| ---------- | ------------------------- | ------------- |
| GPU        | RTX 3090 24GB             | RTX 4090 24GB |
| VRAM       | 16GB (con descarga a CPU) | 24GB          |
| RAM        | 32GB                      | 64GB          |
| Disco      | 40GB                      | 60GB          |
| CUDA       | 12.0+                     | 12.1+         |

**GPU recomendada de Clore.ai**: RTX 4090 24GB (\~$0.5–2/día) — generación subsegundo

### Comparación de velocidad: FLUX.1 vs FLUX.2 Klein

| GPU      | FLUX.1 dev (20 pasos) | FLUX.2 Klein | Aceleración |
| -------- | --------------------- | ------------ | ----------- |
| RTX 3090 | \~25 s                | \~1.2 seg    | 20×         |
| RTX 4090 | \~12 seg              | \~0.4 seg    | 30×         |
| RTX 5090 | \~8 seg               | \~0.25 seg   | 32×         |
| H100     | \~5 seg               | \~0.15 seg   | 33×         |

## Inicio rápido con diffusers

```python
import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.2-klein",
    torch_dtype=torch.bfloat16
)
pipe.to("cuda")

# ¡Genera imagen en < 0.5 segundos!
image = pipe(
    prompt="un equipo de minería GPU cyberpunk en una sala de servidores iluminada con neón, fotorrealista",
    height=1024,
    width=1024,
    num_inference_steps=4,  # ¡Klein solo necesita 4 pasos!
    guidance_scale=3.5,
).images[0]

image.save("output.png")
```

### Modo de memoria eficiente (GPUs de 16GB)

```python
pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.2-klein",
    torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload()  # Cabe en 16GB
pipe.vae.enable_tiling()         # Ahorra ~2GB

image = pipe("un paisaje de montaña al atardecer", num_inference_steps=4).images[0]
```

## Flujo de trabajo en ComfyUI

FLUX.2 Klein funciona como reemplazo directo en flujos de trabajo existentes de FLUX.1 en ComfyUI:

1. Descarga el checkpoint de FLUX.2 Klein a `ComfyUI/models/diffusion_models/`
2. En tu flujo de trabajo, cambia el nodo de checkpoint para que apunte a FLUX.2 Klein
3. Reduce los pasos a 4 (en lugar de 20–50 para FLUX.1)
4. Establece la escala de guidance a 3.0–4.0

```bash
# Descargar modelo para ComfyUI
cd ComfyUI/models/diffusion_models/
wget https://huggingface.co/black-forest-labs/FLUX.2-klein/resolve/main/flux2-klein.safetensors
```

## Generación por lotes

Con generación subsegundo, FLUX.2 Klein permite procesamiento masivo por lotes:

```python
import torch
from diffusers import FluxPipeline

pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.2-klein", torch_dtype=torch.bfloat16
).to("cuda")

prompts = [
    "un auto deportivo rojo en una carretera de montaña, cinematográfico",
    "el interior de una cafetería acogedora, iluminación cálida",
    "un astronauta flotando sobre la Tierra, hiperrealista",
    "un castillo medieval en otoño, arte fantástico",
    # ... añade cientos más
]

for i, prompt in enumerate(prompts):
    image = pipe(prompt, num_inference_steps=4, guidance_scale=3.5).images[0]
    image.save(f"batch_{i:04d}.png")
    print(f"Generado {i+1}/{len(prompts)}")

# En RTX 4090: ¡~100 imágenes en menos de 1 minuto!
```

## Soporte LoRA

```python
pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.2-klein", torch_dtype=torch.bfloat16
).to("cuda")

# Cargar un LoRA entrenado en la arquitectura FLUX
pipe.load_lora_weights("your-lora/flux2-style-lora", weight_name="lora.safetensors")
pipe.fuse_lora(lora_scale=0.8)

image = pipe("un retrato en el estilo entrenado", num_inference_steps=4).images[0]
```

## Consejos para usuarios de Clore.ai

* **Rey del procesamiento por lotes**: A 0.4 seg/imagen, puedes generar más de 10,000 imágenes por hora en RTX 4090
* **Solo 4 pasos**: No uses más — Klein está optimizado para 4 pasos (más no mejora la calidad)
* **Mismas LoRAs que FLUX.1**: La mayoría de LoRAs de FLUX.1 son compatibles con Klein
* **Reemplazo directo en ComfyUI**: Simplemente cambia el checkpoint, cambia los pasos a 4
* **RTX 3090 es viable**: 1.2 seg/imagen sigue siendo excelente a $0.3/día

## Solución de problemas

| Problema                       | Solución                                                                           |
| ------------------------------ | ---------------------------------------------------------------------------------- |
| OOM en 24GB                    | Usa `enable_model_cpu_offload()` + `vae.enable_tiling()`                           |
| Imágenes borrosas              | Asegúrate de `num_inference_steps=4`, no menos. Verifica guidance\_scale 3.0–4.0   |
| Primera generación lenta       | Normal — el modelo se carga en la primera llamada (\~30s). Posteriores: subsegundo |
| Error de checkpoint en ComfyUI | Asegúrate de tener el `.safetensors` archivo, no el formato diffusers              |

## Lecturas adicionales

* [Guía de FLUX.1](/guides/guides_v2-es/generacion-de-imagenes/flux.md) — guía original de FLUX con detalles de LoRA y ControlNet
* [Guía ComfyUI](/guides/guides_v2-es/generacion-de-imagenes/comfyui.md) — configuración y flujos de trabajo de ComfyUI
* [Blog de Black Forest Labs](https://blackforestlabs.ai/)
* [Modelo en HuggingFace](https://huggingface.co/black-forest-labs/FLUX.2-klein)


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-es/generacion-de-imagenes/flux2-klein.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.