DeepSeek-R1 रीज़निंग मॉडल
Clore.ai GPUs पर DeepSeek-R1 ओपन-सोर्स रीज़निंग मॉडल चलाएँ
अवलोकन
प्रमुख विशेषताएँ
मॉडल वेरिएंट
वेरिएंट
पैरामीटर
आर्किटेक्चर
FP16 VRAM
Q4 VRAM
Q4 डिस्क
वेरिएंट चुनना
उपयोग का मामला
अनुशंसित वेरिएंट
Clore पर GPU
HuggingFace रिपॉज़िटरीज़
वेरिएंट
रिपॉज़िटरी
आवश्यकताएँ
घटक
न्यूनतम (7B Q4)
अनुशंसित (32B Q4)
Ollama त्वरित प्रारंभ
इंस्टॉल और चलाएँ
उदाहरण इंटरैक्टिव सत्र
OpenAI-अनुकूल API का उपयोग करें
Python क्लाइंट (OpenAI SDK के माध्यम से)
vLLM प्रोडक्शन सेटअप
सिंगल GPU — 7B / 14B
मल्टी-GPU — 32B (अनुशंसित)
मल्टी-GPU — 70B
vLLM एंडपॉइंट को क्वेरी करें
Transformers / Python (के साथ <think> टैग पार्सिंग)
<think> टैग पार्सिंग)बेसिक जेनरेशन
पार्सिंग <think> टैग
<think> टैगस्ट्रीमिंग के साथ <think> स्थिति ट्रैकिंग
<think> स्थिति ट्रैकिंगClore.ai पर Docker तैनाती
Ollama Docker (सबसे सरल)
vLLM Docker (प्रोडक्शन)
Clore.ai तैनातियों के लिए टिप्स
सही GPU चुनना
बजट
GPU
दैनिक लागत
सर्वोत्तम वेरिएंट
प्रदर्शन ट्यूनिंग
संदर्भ लंबाई विचार
कार्य जटिलता
सामान्य सोचने की लंबाई
कुल संदर्भ आवश्यकता
समस्याओं का निवारण
मेमोरी से बाहर (OOM)
मॉडल कोई भी उत्पन्न नहीं करता <think> ब्लॉक
<think> ब्लॉकदोहरावदार या लूपिंग <think> आउटपुट
<think> आउटपुटपहला टोकन धीमा (उच्च TTFT)
Clore इंस्टेंस पर डाउनलोड रुकता है
अधिक पढ़ने के लिए
Last updated
Was this helpful?