Aphrodite Engine
Aphrodite Engine für LLM-Inferenz auf alten und modernen GPUs auf Clore.ai ausführen
Serveranforderungen
Parameter
Minimum
Empfohlen
Schnelle Bereitstellung auf CLORE.AI
Variable
Beispiel
Beschreibung
Schritt-für-Schritt-Einrichtung
1. Mieten Sie einen GPU-Server auf CLORE.AI
2. Verbindung per SSH
3. Aphrodite Engine Image ziehen
4. Aphrodite Engine starten
5. Überprüfen Sie den Server
6. Zugriff über CLORE.AI HTTP-Proxy
Beispielanwendungen
Beispiel 1: OpenAI-kompatibler Chat
Beispiel 2: Fortgeschrittenes Sampling mit Mirostat
Beispiel 3: Kobold-kompatible API
Beispiel 4: Python-Client mit benutzerdefinierten Samplern
Beispiel 5: Batch-Vervollständigungen
Konfiguration
Wichtige Startparameter
Parameter
Standard
Beschreibung
API-Schlüssel-Authentifizierung hinzufügen
Lokale Modelle laden
Leistungs-Tipps
1. Wählen Sie die richtige Quantisierung für Ihre GPU
GPU-VRAM
7B-Modell
13B-Modell
30B-Modell
2. GPU-Speichernutzung optimieren
3. Verwenden Sie bfloat16 auf Ampere+-GPUs
4. Für Rollenspiel/Kreatives Schreiben optimieren
5. Pascal-GPU-Tipps (GTX 10xx)
Fehlerbehebung
Problem: "CUDA capability sm_6x not supported"
Problem: "out of memory" auf kleinen GPUs
Problem: Langsame Token-Generierung
Problem: Modell nicht gefunden / 404-Fehler
Problem: Wiederholte Ausgaben
Problem: Docker-Container beendet sich stillschweigend
Links
Clore.ai GPU-Empfehlungen
Anwendungsfall
Empfohlene GPU
Geschätzte Kosten auf Clore.ai
Zuletzt aktualisiert
War das hilfreich?