Kandinsky

Genera imágenes con el modelo multilingüe Kandinsky en Clore.ai

Genera imágenes con una potente comprensión multilingüe del texto.

circle-check

¿Qué es Kandinsky?

Kandinsky es un modelo de generación de imágenes desarrollado por Sber AI:

  • Fuerte comprensión multilingüe del texto

  • Generación de imágenes de alta calidad

  • Mezcla e interpolación de imágenes

  • Soporte para inpainting y outpainting

  • Pesos de código abierto

Recursos

Versiones del modelo

Versión
Resolución
Calidad
Velocidad

Kandinsky 2.1

768x768

Bueno

Rápido

Kandinsky 2.2

1024x1024

Mejor

Medio

Kandinsky 3

1024x1024

Mejor

Más lento

Requisitos de hardware

Modelo
VRAM
GPU recomendada

Kandinsky 2.2

8GB

RTX 3070

Kandinsky 3

12GB

RTX 3090

Kandinsky 3 (alta resolución)

16GB

RTX 4090

Despliegue rápido

Imagen Docker:

Puertos:

Comando:

Accediendo a tu servicio

Después del despliegue, encuentra tu http_pub URL en Mis Pedidos:

  1. Ir a Mis Pedidos página

  2. Haz clic en tu pedido

  3. Encuentra la http_pub URL (por ejemplo, abc123.clorecloud.net)

Usa https://TU_HTTP_PUB_URL en lugar de localhost en los ejemplos abajo.

Instalación

Uso básico

Kandinsky 3

Kandinsky 2.2

Prompts multilingües

Kandinsky admite múltiples idiomas:

Mezcla de imágenes

Rellenado (Inpainting)

Imagen a imagen

Generación por lotes

Interfaz Gradio

Optimización de memoria

Rendimiento

Modelo
Resolución
GPU
Tiempo

Kandinsky 3

1024x1024

RTX 3090

15 s

Kandinsky 3

1024x1024

RTX 4090

10s

Kandinsky 2.2

768x768

RTX 3090

8s

Kandinsky 2.2

768x768

RTX 4090

5s

Solución de problemas

Memoria insuficiente

Problema: OOM de CUDA al generar

Soluciones:

  • Habilitar descarga a CPU

  • Reducir resolución

  • Usar Kandinsky 2.2 en lugar de 3

  • Habilitar segmentación de atención

Renderizado de texto deficiente

Problema: El texto en las imágenes se ve incorrecto

Soluciones:

  • Kandinsky tiene dificultades con el renderizado de texto (como la mayoría de los modelos de difusión)

  • Agregar texto en postprocesado

  • Usar prompts que eviten texto

Los colores se ven mal

Problema: Los colores de la imagen están lavados o sobresaturados

Soluciones:

  • Ajustar la escala de guidance (probar rango 3-6)

  • Especificar preferencias de color en el prompt

  • Postprocesar con corrección de color

Generación lenta

Problema: Tarda demasiado en generar

Soluciones:

  • Reducir pasos de inferencia (30 suele ser suficiente)

  • Usar precisión fp16

  • Usar Kandinsky 2.2 para resultados más rápidos

  • Reducir resolución para vistas previas

Comparación con otros modelos

Función
Kandinsky 3
SDXL
FLUX

Multilingüe

Excelente

Limitado

Limitado

Calidad de imagen

Alto

Muy alta

La más alta

Velocidad

Medio

Medio

Lento

VRAM

12GB

12GB

24GB

Rellenado (Inpainting)

Limitado

Estimación de costos

Tarifas típicas del marketplace de CLORE.AI (a fecha de 2024):

GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Los precios varían según el proveedor. Consulta CLORE.AI Marketplacearrow-up-right para las tarifas actuales.

Próximos pasos

  • FLUX Generation - Imágenes de la más alta calidad

  • Stable Diffusion - Opción más popular

  • PixArt - Generación rápida

  • ComfyUI - Flujos de trabajo avanzados

Última actualización

¿Te fue útil?