F5-TTS

Schnelles und flüssiges Text-to-Speech mit F5-TTS auf Clore.ai GPUs

Erzeuge natürliche Sprache mit F5-TTS – einem schnellen und flüssigen TTS-System.

circle-check

Mieten auf CLORE.AI

  1. Nach GPU-Typ, VRAM und Preis filtern

  2. Wählen On-Demand (Festpreis) oder Spot (Gebotspreis)

  3. Konfigurieren Sie Ihre Bestellung:

    • Docker-Image auswählen

    • Ports festlegen (TCP für SSH, HTTP für Web-UIs)

    • Umgebungsvariablen bei Bedarf hinzufügen

    • Startbefehl eingeben

  4. Zahlung auswählen: CLORE, BTC, oder USDT/USDC

  5. Bestellung erstellen und auf Bereitstellung warten

Zugriff auf Ihren Server

  • Verbindungsdetails finden Sie in Meine Bestellungen

  • Webschnittstellen: Verwenden Sie die HTTP-Port-URL

  • SSH: ssh -p <port> root@<proxy-address>

Was ist F5-TTS?

F5-TTS bietet:

  • Schnelle Inferenz (schneller als Echtzeit)

  • Natürliche Prosodie und Intonation

  • Zero-Shot Stimmmodellierung (Voice Cloning)

  • Mehrsprachige Unterstützung

Ressourcen

Empfohlene Hardware

Komponente
Minimum
Empfohlen
Optimal

GPU

RTX 3060 12GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

6GB

12GB

16GB

CPU

4 Kerne

8 Kerne

16 Kerne

RAM

16GB

32GB

64GB

Speicher

20GB SSD

50GB NVMe

100GB NVMe

Internet

100 Mbps

500 Mbps

1 Gbps

Schnelle Bereitstellung auf CLORE.AI

Docker-Image:

Ports:

Befehl:

Zugriff auf Ihren Dienst

Nach der Bereitstellung finden Sie Ihre http_pub URL in Meine Bestellungen:

  1. Gehen Sie zur Meine Bestellungen Seite

  2. Klicken Sie auf Ihre Bestellung

  3. Finden Sie die http_pub URL (z. B., abc123.clorecloud.net)

Verwenden Sie https://IHRE_HTTP_PUB_URL anstelle von localhost in den Beispielen unten.

Installation

Was Sie erstellen können

Stimmeninhalte

  • Podcast-Produktion

  • Hörbucherzählung

  • Voice-over für Videos

Barrierefreiheit

  • Screenreader

  • Dokumentenleser

  • Lernmaterialien

Interaktive Anwendungen

  • Sprachassistenten

  • Spiel-NPCs

  • Kundendienst-Bots

Kreative Projekte

  • Charakterstimmen

  • Hörspiele

  • Musikalische Gesangsstimmen

Grundlegende Verwendung

Einfaches TTS

Stimmenklon

Mehrsprachige Unterstützung

Batch-Verarbeitung

Langform-Audio

Gradio-Oberfläche

API-Server

Leistung

Textlänge
GPU
Generierungszeit
Echtzeitfaktor

100 Zeichen

RTX 3090

0.5s

5x

100 Zeichen

RTX 4090

0.3s

8x

500 Zeichen

RTX 4090

1.2s

10x

1000 Zeichen

A100

2.0s

12x

Häufige Probleme & Lösungen

Schlechte Stimmenübereinstimmung

Problem: Generierte Stimme stimmt nicht mit der Referenz überein

Lösungen:

  • Verwende 5–15 Sekunden klaren Referenzton

  • Gib eine genaue Transkription des Referenztexts an

  • Vermeide Hintergrundgeräusche in der Referenz

  • Stimme und Text sollten dieselbe Sprache haben

Ausspracheprobleme

Problem: Wörter oder Namen werden falsch ausgesprochen

Lösungen:

Audioqualitätsprobleme

Problem: Ausgabe klingt robotisch oder verzerrt

Lösungen:

  • Verwende hochwertige Referenzaufnahmen (24 kHz+)

  • Reinige die Referenz von Störgeräuschen

  • Probiere verschiedene Referenzbeispiele aus

  • Erhöhe die Generierungsqualitäts-Einstellungen

Speicherprobleme

Problem: Kein Speicher für lange Texte

Lösungen:

Langsame Generierung

Problem: Dauert zu lange zu generieren

Lösungen:

  • Verwende GPU-Inferenz (CUDA)

  • Reduziere chunk_size für schnellere Verarbeitung

  • Verwende eine RTX 4090 oder besser

  • Aktiviere Halbfeld-Präzision (fp16)

Fehlerbehebung

Stimme stimmt nicht mit der Referenz überein

  • Verwende 5–15 Sekunden klaren Referenzton

  • Transkribiere den Referenztext genau

  • Vermeide Hintergrundgeräusche in der Referenz

Audioqualitätsprobleme

  • Verwende Referenzen mit hoher Abtastrate (24 kHz+)

  • Reinige die Referenz von Störgeräuschen

  • Probiere verschiedene Referenzbeispiele aus

Langsame Generierung

  • Verwende CUDA (nicht CPU)

  • Reduziere die Textlänge oder teile sie in Abschnitte

  • Verwende kleinere Batch-Größen

Sprachinkongruenz

  • Stimme und Referenzaudio sollten dieselbe Sprache haben

  • Einige Sprachen benötigen spezielle Modelle

Kostenabschätzung

Typische CLORE.AI-Marktplatztarife (Stand 2024):

GPU
Stundensatz
Tagessatz
4-Stunden-Sitzung

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Preise variieren je nach Anbieter und Nachfrage. Prüfen Sie CLORE.AI Marketplacearrow-up-right auf aktuelle Preise.

Geld sparen:

  • Verwenden Sie Spot Markt für flexible Workloads (oft 30–50% günstiger)

  • Bezahlen mit CLORE Token

  • Preise bei verschiedenen Anbietern vergleichen

Nächste Schritte

Zuletzt aktualisiert

War das hilfreich?