मॉडल संगतता
Clore.ai के लिए AI मॉडल और GPU संगतता मैट्रिक्स
त्वरित संदर्भ
भाषा मॉडल (LLM)
मॉडल
पैरामीटर
न्यूनतम VRAM
अनुशंसित
क्वांटाइज़ेशन
छवि जनरेशन मॉडल
मॉडल
न्यूनतम VRAM
अनुशंसित
नोट्स
वीडियो जनरेशन मॉडल
मॉडल
न्यूनतम VRAM
अनुशंसित
आउटपुट
ऑडियो मॉडल
मॉडल
न्यूनतम VRAM
अनुशंसित
कार्य
विजन और विज़न-लैंग्वेज मॉडल
मॉडल
न्यूनतम VRAM
अनुशंसित
कार्य
फाइन-ट्यूनिंग और प्रशिक्षण उपकरण
उपकरण / विधि
न्यूनतम VRAM
अनुशंसित GPU
कार्य
विस्तृत संगतता तालिकाएँ
GPU द्वारा LLM
GPU
Max मॉडल (Q4)
Max मॉडल (Q8)
Max मॉडल (FP16)
GPU द्वारा इमेज जनरेशन
GPU
SD 1.5
SDXL
FLUX schnell
FLUX dev
GPU द्वारा वीडियो जनरेशन
GPU
SVD
AnimateDiff
Wan2.1
Hunyuan
क्वांटाइज़ेशन गाइड
क्वांटाइज़ेशन क्या है?
फॉर्मेट
बिट्स
VRAM में कमी
गुणवत्ता ह्रास
VRAM कैलकुलेटर
मॉडल आकार
FP16
Q8
Q4
उपयोग के मामले के अनुसार अनुशंसित क्वांटाइज़ेशन
उपयोग का मामला
अनुशंसित
क्यों
संदर्भ लंबाई बनाम VRAM
कैसे संदर्भ VRAM को प्रभावित करता है
मॉडल
डिफ़ॉल्ट संदर्भ
अधिकतम संदर्भ
1K टोकन पर VRAM
GPU द्वारा संदर्भ (Llama 3 8B Q4)
GPU
आरामदायक संदर्भ
अधिकतम संदर्भ
मल्टी-GPU कॉन्फ़िगरेशन
टेंसर पैरालेलिज़्म
कॉन्फ़िगरेशन
कुल VRAM
Max मॉडल (FP16)
vLLM मल्टी-GPU
विशिष्ट मॉडल गाइड
Llama 3.1 परिवार
वैरिएंट
पैरामीटर
न्यूनतम GPU
अनुशंसित सेटअप
Mistral/Mixtral परिवार
वैरिएंट
पैरामीटर
न्यूनतम GPU
अनुशंसित सेटअप
Qwen 2.5 परिवार
वैरिएंट
पैरामीटर
न्यूनतम GPU
अनुशंसित सेटअप
DeepSeek मॉडल
वैरिएंट
पैरामीटर
न्यूनतम GPU
अनुशंसित सेटअप
समस्याओं का निवारण
"CUDA out of memory"
"मॉडल बहुत बड़ा है"
"धीमी जनरेशन"
अगले कदम
Last updated
Was this helpful?