Fish Speech
Führen Sie Fish Speech für mehrsprachige TTS und Zero-Shot-Stimmenklonung auf Clore.ai GPUs aus
Serveranforderungen
Parameter
Minimum
Empfohlen
Schnelle Bereitstellung auf CLORE.AI
1. Finden Sie einen geeigneten Server
2. Konfigurieren Sie Ihre Bereitstellung
3. Greifen Sie auf die Oberfläche zu
Schritt-für-Schritt-Einrichtung
Schritt 1: SSH auf Ihren Server
Schritt 2: Das Docker-Container-Image herunterladen und ausführen
Schritt 3: GPU-Zugriff verifizieren
Schritt 4: Modell-Download überprüfen
Schritt 5: Auf die WebUI zugreifen
Schritt 6: (Optional) API-Server aktivieren
Beispielanwendungen
Beispiel 1: Grundlegendes Text-to-Speech über die WebUI
Beispiel 2: Zero-Shot-Voice-Cloning
Beispiel 3: API-basiertes TTS (Python)
Beispiel 4: Mehrsprachiges TTS
Beispiel 5: Stapelverarbeitung von Audiodateien
Konfiguration
Docker Compose (Produktions-Setup)
Wichtige Konfigurationsoptionen
Option
Standard
Beschreibung
Modellvarianten
Modell
Größe
Sprachen
Hinweise
Leistungs-Tipps
1. Aktivieren Sie torch.compile für schnellere Inferenz
2. Verwenden Sie Halbpräzision (FP16)
3. Referenzstimmen vorladen
4. GPU-Speicheroptimierung
5. Anpassung der Batch-Größe
Fehlerbehebung
Problem: Container startet nicht — CUDA nicht gefunden
Problem: Out of Memory (OOM)-Fehler
Problem: Port 7860 nicht erreichbar
Problem: Modell-Download schlägt fehl / langsamer Download
Problem: Audioqualität ist schlecht
Problem: WebUI lädt, aber die Generierung hängt
Links
Clore.ai GPU-Empfehlungen
Anwendungsfall
Empfohlene GPU
Geschätzte Kosten auf Clore.ai
Zuletzt aktualisiert
War das hilfreich?