DeepSeek-V3

Clore.ai GPUs पर असाधारण तर्क क्षमता के साथ DeepSeek-V3 चलाएँ

CLORE.AI GPUs पर असाधारण तार्किक क्षमता वाले राज्य-ऑफ-द-आर्ट ओपन-सोर्स LLM DeepSeek-V3 चलाएँ।

circle-check
circle-info

अपडेट: DeepSeek-V3-0324 (मार्च 2024) — DeepSeek-V3 के नवीनतम संशोधन में कोड जेनरेशन, गणितीय तर्क और सामान्य समस्या-समाधान में महत्वपूर्ण सुधार हैं। देखें चेंजलॉग विवरण के लिए अनुभाग।

क्यों DeepSeek-V3?

  • राज्य-ऑफ-द-आर्ट - GPT-4o और Claude 3.5 Sonnet के साथ प्रतिस्पर्धा करता है

  • 671B MoE - कुल 671B पैरामीटर्स, प्रति टोकन 37B सक्रिय (एफिशिएंट इन्फरेंस)

  • सुधरा हुआ तर्क - DeepSeek-V3-0324 गणित और कोड में उल्लेखनीय रूप से बेहतर है

  • कुशल - MoE आर्किटेक्चर घनी (dense) मॉडलों की तुलना में कम्प्यूटेशनल लागत कम करता है

  • ओपन सोर्स - MIT लाइसेंस के तहत पूरी तरह से खुला वेट्स

  • लंबा संदर्भ - 128K टोकन संदर्भ विंडो

DeepSeek-V3-0324 में क्या नया है

DeepSeek-V3-0324 (मार्च 2024 संशोधन) प्रमुख क्षेत्रों में महत्वपूर्ण सुधार लाता है:

कोड जेनरेशन

  • +8-12% HumanEval पर मूल V3 की तुलना में

  • मल्टी-फाइल कोडबेस और जटिल रीफ़ैक्टरिंग कार्यों में बेहतर

  • आधुनिक फ्रेमवर्क्स की बेहतर समझ (FastAPI, Pydantic v2, LangChain v0.3)

  • छूट के बिना पूर्ण, चलने योग्य कोड उत्पन्न करने में अधिक विश्वसनीय

गणितीय तर्क

  • MATH-500 पर +5% बेंचमार्क

  • स्टेप-बाय-स्टेप प्रमाण निर्माण में बेहतर

  • मल्टी-स्टेप समस्याओं के लिए संख्यात्मक सटीकता में सुधार

  • मध्य-समाधान में गलतियों की पहचान और सुधार करने की बढ़ी हुई क्षमता

सामान्य तर्क

  • तर्कसंगत निष्कर्ष और कारणात्मक इनफेरेंस में मजबूत

  • मल्टी-स्टेप योजना कार्यों में बेहतर

  • एज केसेस और अस्पष्ट प्रॉम्प्ट्स पर अधिक सुसंगत प्रदर्शन

  • जटिल, बहु-प्रतिबंध अनुरोधों पर निर्देश पालन में सुधार

CLORE.AI पर त्वरित डिप्लॉय

Docker इमेज:

पोर्ट:

कमांड (मल्टी-GPU आवश्यक):

अपनी सेवा तक पहुँचना

डिप्लॉयमेंट के बाद, अपना खोजें http_pub URL में मेरे ऑर्डर:

  1. जाएँ मेरे ऑर्डर पृष्ठ

  2. अपने ऑर्डर पर क्लिक करें

  3. खोजें http_pub URL (उदा., abc123.clorecloud.net)

उपयोग करें https://YOUR_HTTP_PUB_URL की बजाय localhost नीचे दिए उदाहरणों में।

जांचें कि यह काम कर रहा है

circle-exclamation

मॉडल वेरिएंट

मॉडल
पैरामीटर
Active
आवश्यक VRAM
HuggingFace

हार्डवेयर आवश्यकताएँ

फुल प्रिसिशन

मॉडल
न्यूनतम
अनुशंसित

DeepSeek-V3-0324

8x A100 80GB

8x H100 80GB

DeepSeek-V2.5

4x A100 80GB

4x H100 80GB

DeepSeek-V2-Lite

RTX 4090 24GB

A100 40GB

क्वांटाइज़्ड (AWQ/GPTQ)

मॉडल
क्वांटाइज़ेशन
VRAM

DeepSeek-V3-0324

INT4

4x80GB

DeepSeek-V2.5

INT4

2x80GB

DeepSeek-V2-Lite

INT4

8GB

इंस्टॉलेशन

vLLM का उपयोग (अनुशंसित)

Transformers का उपयोग करना

Ollama का उपयोग करना

API उपयोग

OpenAI-अनुकूल API (vLLM)

स्ट्रीमिंग

cURL

DeepSeek-V2-Lite (सिंगल GPU)

सीमित हार्डवेयर वाले उपयोगकर्ताओं के लिए:

कोड जेनरेशन

DeepSeek-V3-0324 कोड के लिए सर्वश्रेष्ठ-इन-क्लास है:

उन्नत कोड कार्य जिनमें V3-0324 उत्कृष्ट है:

गणित एवं तर्क

मल्टी-GPU कॉन्फ़िगरेशन

8x GPU (फुल मॉडल — V3-0324)

4x GPU (V2.5)

प्रदर्शन

थ्रूपुट (टोकन/सेकंड)

मॉडल
GPUs
संदर्भ
टोकन/सेकंड

DeepSeek-V3-0324

8x H100

32K

~85

DeepSeek-V3-0324

8x A100 80GB

32K

~52

DeepSeek-V3-0324 INT4

4x A100 80GB

16K

~38

DeepSeek-V2.5

4x A100 80GB

16K

~70

DeepSeek-V2.5

2x A100 80GB

8K

~45

DeepSeek-V2-Lite

RTX 4090

8K

~40

DeepSeek-V2-Lite

RTX 3090

4K

~25

पहले टोकन तक का समय (TTFT)

मॉडल
कॉन्फ़िगरेशन
TTFT

DeepSeek-V3-0324

8x H100

~750ms

DeepSeek-V3-0324

8x A100

~1100ms

DeepSeek-V2.5

4x A100

~500ms

DeepSeek-V2-Lite

RTX 4090

~150ms

मेमोरी उपयोग

मॉडल
प्रिसिशन
आवश्यक VRAM

DeepSeek-V3-0324

FP16

8x 80GB

DeepSeek-V3-0324

INT4

4x 80GB

DeepSeek-V2.5

FP16

4x 80GB

DeepSeek-V2.5

INT4

2x 80GB

DeepSeek-V2-Lite

FP16

20GB

DeepSeek-V2-Lite

INT4

10GB

बेंचमार्क्स

DeepSeek-V3-0324 बनाम प्रतियोगिता

बेंचमार्क
V3-0324
V3 (मूल)
GPT-4o
Claude 3.5 Sonnet

MMLU

88.5%

87.1%

88.7%

88.3%

HumanEval

90.2%

82.6%

90.2%

92.0%

MATH-500

67.1%

61.6%

76.6%

71.1%

GSM8K

92.1%

89.3%

95.8%

96.4%

LiveCodeBench

72.4%

65.9%

71.3%

73.8%

Codeforces रेटिंग

1850

1720

1780

1790

नोट: MATH-500 में V3 → V3-0324 सुधार +5.5 प्रतिशत अंक है।

Docker Compose

GPU आवश्यकताओं का सारांश

उपयोग का मामला
अनुशंसित सेटअप
लागत/घंटा

फुल DeepSeek-V3-0324

8x A100 80GB

~$2.00

DeepSeek-V2.5

4x A100 80GB

~$1.00

डेवलपमेंट/टेस्टिंग

RTX 4090 (V2-Lite)

~$0.10

प्रोडक्शन API

8x H100 80GB

~$3.00

लागत अनुमान

सामान्य CLORE.AI मार्केटप्लेस दरें:

GPU कॉन्फ़िगरेशन
घंटात्मक दर
दैनिक दर

RTX 4090 24GB

~$0.10

~$2.30

A100 40GB

~$0.17

~$4.00

A100 80GB

~$0.25

~$6.00

4x A100 80GB

~$1.00

~$24.00

8x A100 80GB

~$2.00

~$48.00

कीमतें प्रदाता के अनुसार विभिन्न होती हैं। जाँच करें CLORE.AI मार्केटप्लेसarrow-up-right वर्तमान दरों के लिए।

पैसे बचाएँ:

  • उपयोग करें स्पॉट डेवलपमेंट के लिए मार्केट (अक्सर 30-50% सस्ता)

  • भुगतान करें CLORE टोकन के साथ

  • स्केल अप करने से पहले परीक्षण के लिए DeepSeek-V2-Lite का उपयोग करें

समस्याओं का निवारण

आउट ऑफ़ मेमोरी

मॉडल डाउनलोड धीमा

trust_remote_code त्रुटि

मल्टी-GPU काम नहीं कर रहा

DeepSeek बनाम अन्य

फ़ीचर
DeepSeek-V3-0324
Llama 3.1 405B
Mixtral 8x22B

पैरामीटर

671B (37B सक्रिय)

405B

176B (44B सक्रिय)

संदर्भ

128K

128K

64K

कोड

उत्कृष्ट

बहुत अच्छा

अच्छा

गणित

उत्कृष्ट

अच्छा

अच्छा

न्यूनतम VRAM

8x80GB

8x80GB

2x80GB

लाइसेंस

MIT

Llama 3.1

Apache 2.0

DeepSeek-V3 का उपयोग करें जब:

  • सबसे अच्छा तर्क प्रदर्शन आवश्यक हो

  • कोड जेनरेशन प्राथमिक उपयोग हो

  • गणित/तर्क कार्य महत्वपूर्ण हों

  • मल्टी-GPU सेटअप उपलब्ध हो

  • पूरी तरह से ओपन-सोर्स वेट्स (MIT लाइसेंस) चाहिए

अगले कदम

Last updated

Was this helpful?