कैंडिंस्की

Clore.ai पर Kandinsky के बहुभाषी मॉडल के साथ इमेज जेनरेट करें

मल्टीलिंग्वल टेक्स्ट समझ के साथ छवियाँ उत्पन्न करें।

circle-check

कैंडिंस्की क्या है?

कैंडिंस्की Sber AI द्वारा विकसित एक इमेज जनरेशन मॉडल है:

  • मजबूत बहुभाषी टेक्स्ट समझ

  • उच्च गुणवत्ता वाली छवि जनरेशन

  • इमेज मिश्रण और इंटरपोलेशन

  • इनपेंटिंग और आउटपेंटिंग समर्थन

  • ओपन सोर्स वेट्स

संसाधन

मॉडल वर्ज़न

संस्करण
रिज़ॉल्यूशन
गुणवत्ता
स्पीड

कैंडिंस्की 2.1

768x768

अच्छा

तेज़

कैंडिंस्की 2.2

1024x1024

बेहतर

मध्यम

कैंडिंस्की 3

1024x1024

सर्वोत्तम

धीमा

हार्डवेयर आवश्यकताएँ

मॉडल
VRAM
अनुशंसित GPU

कैंडिंस्की 2.2

8GB

RTX 3070

कैंडिंस्की 3

12GB

RTX 3090

कैंडिंस्की 3 (उच्च रिज़ॉल्यूशन)

16GB

RTX 4090

त्वरित तैनाती

Docker इमेज:

पोर्ट:

कमांड:

अपनी सेवा तक पहुँचना

डिप्लॉयमेंट के बाद, अपना खोजें http_pub URL में मेरे ऑर्डर:

  1. जाएँ मेरे ऑर्डर पृष्ठ

  2. अपने ऑर्डर पर क्लिक करें

  3. खोजें http_pub URL (उदा., abc123.clorecloud.net)

उपयोग करें https://YOUR_HTTP_PUB_URL की बजाय localhost नीचे दिए उदाहरणों में।

इंस्टॉलेशन

मूल उपयोग

कैंडिंस्की 3

कैंडिंस्की 2.2

मल्टीलिंग्वल प्रॉम्प्ट्स

कैंडिंस्की कई भाषाओं का समर्थन करता है:

इमेज मिश्रण

इनपेंटिंग

इमेज-टू-इमेज

बैच जनरेशन

Gradio इंटरफ़ेस

मेमोरी अनुकूलन

प्रदर्शन

मॉडल
रिज़ॉल्यूशन
GPU
समय

कैंडिंस्की 3

1024x1024

RTX 3090

15s

कैंडिंस्की 3

1024x1024

RTX 4090

10s

कैंडिंस्की 2.2

768x768

RTX 3090

8s

कैंडिंस्की 2.2

768x768

RTX 4090

5s

समस्याओं का निवारण

आउट ऑफ़ मेमोरी

समस्या: जनरेट करते समय CUDA OOM

समाधान:

  • CPU ऑफलोडिंग सक्षम करें

  • रिज़ॉल्यूशन घटाएँ

  • 3 के बजाय Kandinsky 2.2 का उपयोग करें

  • अटेंशन स्लाइसिंग सक्षम करें

खराब टेक्स्ट रेंडरिंग

समस्या: छवियों में टेक्स्ट गलत दिखता है

समाधान:

  • कैंडिंस्की टेक्स्ट रेंडरिंग में संघर्ष करता है (ज्यादातर डिफ्यूजन मॉडलों की तरह)

  • पोस्ट-प्रोसेसिंग में टेक्स्ट जोड़ें

  • ऐसे प्रॉम्प्ट्स का उपयोग करें जो टेक्स्ट से बचें

रंग गलत दिखते हैं

समस्या: छवि के रंग फीके या अतिसंतृप्त हैं

समाधान:

  • गाइडेंस स्केल समायोजित करें (3-6 रेंज आज़माएँ)

  • प्रॉम्प्ट में रंग वरीयताएँ निर्दिष्ट करें

  • कलर करेक्शन के साथ पोस्ट-प्रोसेस करें

धीमा जनरेशन

समस्या: जनरेट करने में बहुत समय लगता है

समाधान:

  • इन्फरेंस स्टेप्स घटाएँ (अक्सर 30 पर्याप्त होते हैं)

  • fp16 प्रिसिजन का उपयोग करें

  • तेज़ परिणामों के लिए Kandinsky 2.2 का उपयोग करें

  • प्रिव्यू के लिए रिज़ॉल्यूशन घटाएँ

अन्य मॉडलों के साथ तुलना

फ़ीचर
कैंडिंस्की 3
SDXL
FLUX

बहुभाषी

उत्कृष्ट

सीमित

सीमित

छवि गुणवत्ता

उच्च

बहुत उच्च

सबसे ऊँचा

स्पीड

मध्यम

मध्यम

धीमा

VRAM

12GB

12GB

24GB

इनपेंटिंग

हां

हां

सीमित

लागत अनुमान

सामान्य CLORE.AI मार्केटप्लेस दरें (2024 के अनुसार):

GPU
घंटात्मक दर
दैनिक दर
4-घंटे सत्र

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

कीमतें प्रदाता के अनुसार विभिन्न होती हैं। जाँच करें CLORE.AI मार्केटप्लेसarrow-up-right वर्तमान दरों के लिए।

अगले कदम

  • FLUX जनरेशन - उच्चतम गुणवत्ता वाली छवियाँ

  • स्टेबल डिफ्यूज़न - सबसे लोकप्रिय विकल्प

  • पिक्सआर्ट - तेज़ जनरेशन

  • ComfyUI - उन्नत वर्कफ़्लो

Last updated

Was this helpful?