Mistral.rs
Was ist Mistral.rs?
Hauptfunktionen
Unterstützte Modellfamilien
Familie
Format
Engine
Schnellstart auf Clore.ai
Schritt 1: Finden Sie einen GPU-Server
Schritt 2: Mistral.rs Docker bereitstellen
Container-Port
Zweck
Schritt 3: Verbinden und Überprüfen
Den Server starten
Schnellstart mit GGUF-Modell
Mistral 7B bereitstellen (SafeTensors)
Mit In-Situ-Quantisierung (ISQ) bereitstellen
Vision Language Model
Spekulatives Decoding
API-Nutzung
OpenAI-kompatible Endpunkte
Endpunkt
Methode
Beschreibung
Python-Beispiel
Streaming-Antwort
Vision-/Bild-Eingabe
cURL-Beispiele
Konfigurationsoptionen
Server-Flags
ISQ-Quantisierungsreferenz
ISQ-Option
Bits
Qualität
VRAM (7B)
Erweiterte Funktionen
X-LoRA (Mixture of LoRA Adapters)
Re-Quantisierung zur Laufzeit
Anfrageprotokollierung
Performance-Tuning
Für Durchsatz optimieren
Für niedrige Latenz optimieren
Leistung überwachen
Docker Compose
Vom Quellcode bauen
Fehlerbehebung
CUDA-Bibliothek nicht gefunden
Modell-Download schlägt fehl
Port 8080 in Benutzung
Während der Quantisierung kein Speicher mehr
Clore.ai GPU-Empfehlungen
GPU
VRAM
Clore.ai-Preis
Empfohlene Verwendung
Durchsatz (Mistral 7B Q4)
Ressourcen
Zuletzt aktualisiert
War das hilfreich?