Phi-4

Clore.ai GPUs पर Microsoft के Phi-4 छोटे भाषा मॉडल चलाएँ

Microsoft का Phi-4 चलाएँ - एक छोटा लेकिन शक्तिशाली भाषा मॉडल।

circle-check

CLORE.AI पर किराये पर लेना

  1. GPU प्रकार, VRAM, और मूल्य के अनुसार फ़िल्टर करें

  2. चुनें ऑन-डिमांड (निश्चित दर) या स्पॉट (बिड प्राइस)

  3. अपना ऑर्डर कॉन्फ़िगर करें:

    • Docker इमेज चुनें

    • पोर्ट सेट करें (SSH के लिए TCP, वेब UI के लिए HTTP)

    • यदि आवश्यक हो तो एनवायरनमेंट वेरिएबल जोड़ें

    • स्टार्टअप कमांड दर्ज करें

  4. भुगतान चुनें: CLORE, BTC, या USDT/USDC

  5. ऑर्डर बनाएं और डिप्लॉयमेंट का इंतज़ार करें

अपने सर्वर तक पहुँचें

  • कनेक्शन विवरण में खोजें मेरे ऑर्डर

  • वेब इंटरफेस: HTTP पोर्ट URL का उपयोग करें

  • SSH: ssh -p <port> root@<proxy-address>

Phi-4 क्या है?

Microsoft का Phi-4 यह प्रदान करता है:

  • उत्कृष्ट प्रदर्शन के साथ 14B पैरामीटर्स

  • बेंचमार्क्स पर बड़े मॉडलों को मात देता है

  • मजबूत तर्क क्षमता और गणित

  • कुशल इनफेरेंस

मॉडल वेरिएंट

मॉडल
पैरामीटर
VRAM
विशेषता

Phi-4

14B

16GB

सामान्य

Phi-3.5-mini

3.8B

4GB

हल्का

Phi-3.5-MoE

42B (6.6B सक्रिय)

16GB

मिश्रित विशेषज्ञता

Phi-3.5-vision

4.2B

6GB

दृष्टि

त्वरित तैनाती

Docker इमेज:

पोर्ट:

कमांड:

अपनी सेवा तक पहुँचना

डिप्लॉयमेंट के बाद, अपना खोजें http_pub URL में मेरे ऑर्डर:

  1. जाएँ मेरे ऑर्डर पृष्ठ

  2. अपने ऑर्डर पर क्लिक करें

  3. खोजें http_pub URL (उदा., abc123.clorecloud.net)

उपयोग करें https://YOUR_HTTP_PUB_URL की बजाय localhost नीचे दिए उदाहरणों में।

Ollama का उपयोग करना

इंस्टॉलेशन

मूल उपयोग

Phi-3.5-Vision

छवि समझ के लिए:

गणित और तर्क

कोड जनरेशन

क्वांटाइज्ड इनफेरेंस

Gradio इंटरफ़ेस

प्रदर्शन

मॉडल
GPU
टोकन/सेकंड

Phi-3.5-mini

RTX 3060

~100

Phi-3.5-mini

RTX 4090

~150

Phi-4

RTX 4090

~60

Phi-4

A100

~90

Phi-4 (4-bit)

RTX 3090

~40

बेंचमार्क्स

मॉडल
MMLU
HumanEval
GSM8K

Phi-4

84.8%

82.6%

94.6%

GPT-4-Turbo

86.4%

85.4%

94.2%

Llama-3.1-70B

83.6%

80.5%

92.1%

Phi-4 बहुत बड़े मॉडलों के बराबर है या उन्हें पछाड़ देता है

समस्याओं का निवारण

"trust_remote_code" त्रुटि

  • जोड़ें trust_remote_code=True को from_pretrained()

  • Phi मॉडलों के लिए यह आवश्यक है

दोहराए जाने वाले आउटपुट

  • कम तापमान (0.3-0.6)

  • repetition_penalty=1.1 जोड़ें

  • उपयुक्त चैट टेम्पलेट का उपयोग करें

मेमोरी समस्याएँ

  • Phi-4 कुशल है लेकिन फिर भी 14B के लिए ~8GB की आवश्यकता होती है

  • यदि आवश्यक हो तो 4-बिट क्वांटाइजेशन का उपयोग करें

  • संदर्भ लंबाई घटाएँ

गलत आउटपुट फ़ॉर्मेट

  • उपयोग करें apply_chat_template() सही फ़ॉर्मेटिंग के लिए

  • जांचें कि आप instruct संस्करण का उपयोग कर रहे हैं, base का नहीं

लागत अनुमान

सामान्य CLORE.AI मार्केटप्लेस दरें (2024 के अनुसार):

GPU
घंटात्मक दर
दैनिक दर
4-घंटे सत्र

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

कीमतें प्रदाता और मांग के अनुसार बदलती हैं। जाँच करें CLORE.AI मार्केटप्लेसarrow-up-right वर्तमान दरों के लिए।

पैसे बचाएँ:

  • उपयोग करें स्पॉट लचीले वर्कलोड के लिए मार्केट (अक्सर 30-50% सस्ता)

  • भुगतान करें CLORE टोकन के साथ

  • विभिन्न प्रदाताओं के बीच कीमतों की तुलना करें

उपयोग के मामले

  • गणित ट्यूटरिंग

  • कोड सहायता

  • दस्तावेज़ विश्लेषण (दृष्टि)

  • कुशल एज पर तैनाती

  • लागत-कुशल इनफेरेंस

अगले कदम

  • Qwen2.5 - वैकल्पिक मॉडल

  • Gemma 2 - Google का मॉडल

  • Llama 3.2 - Meta का मॉडल

Last updated

Was this helpful?