Kandinsky

Générez des images avec le modèle multilingue de Kandinsky sur Clore.ai

Générez des images avec une puissante compréhension multilingue du texte.

circle-check

Qu'est-ce que Kandinsky ?

Kandinsky est un modèle de génération d'images développé par Sber AI :

  • Forte compréhension multilingue du texte

  • Génération d'images de haute qualité

  • Mélange et interpolation d'images

  • Prise en charge de l'inpainting et de l'outpainting

  • Poids open source

Ressources

Versions du modèle

Version
Résolution
Qualité
Vitesse

Kandinsky 2.1

768x768

Bon

Rapide

Kandinsky 2.2

1024x1024

Meilleur

Moyen

Kandinsky 3

1024x1024

Meilleur

Plus lent

Exigences matérielles

Modèle
VRAM
GPU recommandé

Kandinsky 2.2

8 Go

RTX 3070

Kandinsky 3

12Go

RTX 3090

Kandinsky 3 (haute résolution)

16Go

RTX 4090

Déploiement rapide

Image Docker :

Ports :

Commande :

Accéder à votre service

Après le déploiement, trouvez votre http_pub URL dans Mes commandes:

  1. Aller à la Mes commandes page

  2. Cliquez sur votre commande

  3. Trouvez l' http_pub URL (par ex., abc123.clorecloud.net)

Utilisez https://VOTRE_HTTP_PUB_URL au lieu de localhost dans les exemples ci-dessous.

Installation

Utilisation de base

Kandinsky 3

Kandinsky 2.2

Prompts multilingues

Kandinsky prend en charge plusieurs langues :

Mélange d'images

Inpainting

Image-à-Image

Génération par lot

Interface Gradio

Optimisation de la mémoire

Performances

Modèle
Résolution
GPU
Temps

Kandinsky 3

1024x1024

RTX 3090

15 s

Kandinsky 3

1024x1024

RTX 4090

10s

Kandinsky 2.2

768x768

RTX 3090

8s

Kandinsky 2.2

768x768

RTX 4090

5s

Dépannage

Mémoire insuffisante

Problème : CUDA OOM when generating

Solutions :

  • Enable CPU offloading

  • Reduce resolution

  • Use Kandinsky 2.2 instead of 3

  • Enable attention slicing

Rendu de texte médiocre

Problème : Le texte dans les images semble incorrect

Solutions :

  • Kandinsky a du mal avec le rendu du texte (comme la plupart des modèles de diffusion)

  • Ajouter le texte en post-traitement

  • Utiliser des prompts qui évitent le texte

Les couleurs semblent incorrectes

Problème : Les couleurs de l'image sont délavées ou trop saturées

Solutions :

  • Ajuster l'échelle de guidance (essayez la plage 3-6)

  • Spécifier des préférences de couleur dans le prompt

  • Post-traiter avec une correction des couleurs

Génération lente

Problème : La génération prend trop de temps

Solutions :

  • Réduire le nombre d'étapes d'inférence (30 suffit souvent)

  • Utiliser la précision fp16

  • Utiliser Kandinsky 2.2 pour des résultats plus rapides

  • Réduire la résolution pour les aperçus

Comparaison avec d'autres modèles

Fonction
Kandinsky 3
SDXL
FLUX

Multilingue

Excellent

Limité

Limité

Qualité d'image

Élevé

Très élevée

La plus élevée

Vitesse

Moyen

Moyen

Lent

VRAM

12Go

12Go

24 Go

Inpainting

Oui

Oui

Limité

Estimation des coûts

Tarifs typiques du marché CLORE.AI (à partir de 2024) :

GPU
Tarif horaire
Tarif journalier
Session de 4 heures

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Les prix varient selon le fournisseur. Vérifiez CLORE.AI Marketplacearrow-up-right pour les tarifs actuels.

Prochaines étapes

  • FLUX Generation - Images de la plus haute qualité

  • Stable Diffusion - Option la plus populaire

  • PixArt - Génération rapide

  • ComfyUI - Flux de travail avancés

Mis à jour

Ce contenu vous a-t-il été utile ?