LocalAI
Selbst gehostete OpenAI-kompatible API mit LocalAI auf Clore.ai
Serveranforderungen
Parameter
Minimum
Empfohlen
Was ist LocalAI?
Unterstützte Modelle
Typ
Formate
Beispiele
Schnelle Bereitstellung
Überprüfen, ob es funktioniert
Vorinstallierte Modelle
Modellname
Typ
Beschreibung
Zugriff auf Ihren Dienst
Docker-Bereitstellung (Alternative)
Modelle herunterladen
Aus der Modellgalerie
Von Hugging Face
Modellkonfiguration
API-Nutzung
Chat-Completions (OpenAI-kompatibel)
Streaming
Embeddings
Bildgenerierung
cURL-Beispiele
Chat
Embeddings
Text-zu-Sprache (TTS)
Speech-to-Text (STT)
Reranking
Vollständige API-Referenz
Standardendpunkte (OpenAI-kompatibel)
Endpunkt
Methode
Beschreibung
Zusätzliche Endpunkte
Endpunkt
Methode
Beschreibung
Version abrufen
Swagger-Dokumentation
GPU-Beschleunigung
CUDA-Backend
Vollständiges GPU-Offload
Mehrere Modelle
Performance-Tuning
Für Geschwindigkeit
Für Speicher
Benchmarks
Modell
GPU
Tokens/sec
Fehlerbehebung
HTTP 502 auf http_pub-URL
Modell wird nicht geladen
Langsame Antworten
Kein Speicher mehr
Probleme bei der Bildgenerierung
Kostenabschätzung
GPU
VRAM
Preis/Tag
Geeignet für
Nächste Schritte
Zuletzt aktualisiert
War das hilfreich?