अवलोकन

CLORE.AI GPUs पर इन्फरेंस और चैट अनुप्रयोगों के लिए बड़े भाषा मॉडल (LLMs) चलाएँ।

लोकप्रिय टूल्स

टूल
उपयोग का मामला
कठिनाई

सबसे आसान LLM सेटअप

शुरुआती

ChatGPT जैसी इंटरफ़ेस

शुरुआती

उच्च-थ्रूपुट उत्पादन सेवा

मध्यम

कुशल GGUF इन्फरेंस

आसान

पूर्ण-विशेषताओं वाली चैट UI

आसान

सबसे तेज़ EXL2 इन्फरेंस

मध्यम

OpenAI-अनुकूल API

मध्यम

मॉडल गाइड्स

मॉडल
पैरामीटर
उत्तम हेतु

671B MoE

तर्क, कोड, गणित

0.5B-72B

बहुभाषी, कोड

7B / 8x7B

सामान्य प्रयोजन

6.7B-33B

कोड जनरेशन

7B-34B

कोड पूरा करना

2B-27B

कुशल इन्फरेंस

14B

छोटा पर सक्षम

GPU अनुशंसाएँ

मॉडल आकार
न्यूनतम GPU
अनुशंसित

7B (Q4)

RTX 3060 12GB

RTX 3090

13B (Q4)

RTX 3090 24GB

RTX 4090

34B (Q4)

2x RTX 3090

A100 40GB

70B (Q4)

A100 80GB

2x A100

क्वांटाइज़ेशन गाइड

फ़ॉर्मेट
VRAM उपयोग
गुणवत्ता
स्पीड

Q2_K

न्यूनतम

खराब

सबसे तेज

Q4_K_M

कम

अच्छा

तेज़

Q5_K_M

मध्यम

बहुत अच्छा

मध्यम

Q8_0

उच्च

उत्कृष्ट

धीमा

FP16

अत्यधिक

सर्वोत्तम

सबसे धीमा

इन्हें भी देखें

Last updated

Was this helpful?