PowerInfer
PowerInfer क्या है?
मुख्य क्षमताएँ
Clore.ai पर PowerInfer क्यों उपयोग करें?
हार्डवेयर आवश्यकताएँ
मॉडल आकार
न्यूनतम VRAM
अनुशंसित RAM
प्रदर्शन
Clore.ai पर शीघ्र आरम्भ
चरण 1: अपना सर्वर चुनें
चरण 2: कस्टम Docker इमेज बनाएं
चरण 3: Clore.ai पर तैनात करें
स्रोत से PowerInfer बनाना
बिल्ड सत्यापित करें
मॉडल प्राप्त करना
GGUF मॉडल डाउनलोड करें
न्यूरॉन प्रिडिक्टर जेनरेट करें (PowerInfer के लिए आवश्यक)
इनफेरेंस चलाना
बेसिक इनफेरेंस (प्रिडिक्टर के बिना)
PowerInfer मोड (प्रिडिक्टर के साथ)
इंटरैक्टिव चैट मोड
सर्वर मोड (OpenAI-अनुकूल API)
GPU लेयर स्प्लिट का अनुकूलन
GPU VRAM
7B मॉडल
13B मॉडल
34B मॉडल
70B मॉडल
प्रदर्शन बेंचमार्क्स
थ्रूपुट तुलना (Llama 2 70B, RTX 3090)
इंजन
GPU लेयर्स
टोकन/सेकंड
एक सेवा के रूप में चलाना
API उपयोग
समस्या निवारण
CUDA मेमोरी ख़त्म हो गई
धीमा CPU इनफेरेंस
बिल्ड विफल होता है
Clore.ai GPU सिफारिशें
GPU
VRAM
Clore.ai कीमत
अधिकतम मॉडल (Q4)
थ्रूपुट (Llama 2 70B Q4)
संसाधन
Last updated
Was this helpful?