Mistral.rs
Mistral.rs क्या है?
मुख्य विशेषताएँ
समर्थित मॉडल परिवार
परिवार
फॉर्मैट
इंजन
Clore.ai पर शीघ्र आरम्भ
चरण 1: एक GPU सर्वर खोजें
चरण 2: Mistral.rs Docker तैनात करें
कंटेनर पोर्ट
उद्देश्य
चरण 3: कनेक्ट और सत्यापित करें
सर्वर चलाना
GGUF मॉडल के साथ त्वरित प्रारंभ
Mistral 7B (SafeTensors) सर्व करें
इन-सिटू क्वांटाइज़ेशन (ISQ) के साथ सर्व करें
विजन लैंग्वेज मॉडल
स्पेकुलेटिव डिकोडिंग
API उपयोग
OpenAI-संगत एंडपॉइंट्स
एंडपॉइंट
विधि
विवरण
पायथन उदाहरण
स्ट्रीमिंग प्रतिक्रिया
विजन/इमेज इनपुट
cURL उदाहरण
कॉन्फ़िगरेशन विकल्प
सर्वर फ़्लैग्स
ISQ क्वांटाइज़ेशन संदर्भ
ISQ विकल्प
बिट्स
गुणवत्ता
VRAM (7B)
उन्नत सुविधाएँ
X-LoRA (LoRA एडाप्टर का मिश्रण)
रनटाइम पर फिर से-क्वांटाइज़ करें
अनुरोध लॉगिंग
प्रदर्शन ट्यूनिंग
थ्रूपुट के लिए अनुकूलित करें
कम विलंबता के लिए अनुकूलित करें
प्रदर्शन पर नजर रखें
Docker Compose
स्रोत से बिल्ड करना
समस्या निवारण
CUDA पुस्तकालय नहीं मिला
मॉडल डाउनलोड विफल
पोर्ट 8080 उपयोग में है
क्वांटाइज़ेशन के दौरान मेमोरी समाप्त
Clore.ai GPU सिफारिशें
GPU
VRAM
Clore.ai कीमत
अनुशंसित उपयोग
थ्रूपुट (Mistral 7B Q4)
संसाधन
Last updated
Was this helpful?