For the complete documentation index, see llms.txt. This page is also available as Markdown.

Bark TTS

Erzeuge realistische Sprache und Audio mit Bark AI auf Clore.ai

Erzeuge realistische Sprache und Audio mit Bark AI.

Serveranforderungen

Parameter
Minimum
Empfohlen

RAM

8GB

16GB+

VRAM

4GB (klein)

8GB+ (normal)

Netzwerk

200Mbps

500Mbps+

Startzeit

3–5 Minuten

-

Mieten auf CLORE.AI

  1. Nach GPU-Typ, VRAM und Preis filtern

  2. Wählen On-Demand (Festpreis) oder Spot (Gebotspreis)

  3. Konfigurieren Sie Ihre Bestellung:

    • Docker-Image auswählen

    • Ports festlegen (TCP für SSH, HTTP für Web-UIs)

    • Umgebungsvariablen bei Bedarf hinzufügen

    • Startbefehl eingeben

  4. Zahlung auswählen: CLORE, BTC, oder USDT/USDC

  5. Bestellung erstellen und auf Bereitstellung warten

Zugriff auf Ihren Server

  • Verbindungsdetails finden Sie in Meine Bestellungen

  • Webschnittstellen: Verwenden Sie die HTTP-Port-URL

  • SSH: ssh -p <port> root@<proxy-address>

Was ist Bark?

Bark von Suno AI kann erzeugen:

  • Realistische Sprache in mehreren Sprachen

  • Verschiedene Sprecherstimmen

  • Nicht-verbale Geräusche (Lachen, Seufzen)

  • Musik und Soundeffekte

  • Mehrsprachige Sprache

Anforderungen

Qualität
VRAM
Empfohlen

Klein

4GB

RTX 3060

Normal

8GB

RTX 3070

Hoch

12GB

RTX 3090

Schnelle Bereitstellung

Docker-Image:

Ports:

Befehl:

Zugriff auf Ihren Dienst

Nach der Bereitstellung finden Sie Ihre http_pub URL in Meine Bestellungen:

  1. Gehen Sie zur Meine Bestellungen Seite

  2. Klicken Sie auf Ihre Bestellung

  3. Finden Sie die http_pub URL (z. B., abc123.clorecloud.net)

Verwenden Sie https://IHRE_HTTP_PUB_URL anstelle von localhost in den Beispielen unten.

Überprüfen, ob es funktioniert

Installation

Grundlegende Verwendung

Stimmenauswahl

Eingebaute Stimmen

Verfügbare Sprachen

Sprache
Code
Sprecher

Englisch

en

0-9

Deutsch

de

0-9

Spanisch

es

0-9

Französisch

fr

0-9

Hindi

hi

0-9

Italienisch

it

0-9

Japanisch

ja

0-9

Koreanisch

ko

0-9

Polnisch

pl

0-9

Portugiesisch

pt

0-9

Russisch

ru

0-9

Türkisch

tr

0-9

Chinesisch

zh

0-9

Nicht-verbale Geräusche

Bark kann nicht-verbales Audio erzeugen:

Langform-Audio

Für Text länger als 13 Sekunden:

Stimmenklon

Erstelle benutzerdefinierte Stimmprompts:

Batch-Verarbeitung

API-Server

Verwendung

Speicheroptimierung

Für begrenzten VRAM

FP16 aktivieren

Kombination mit anderem Audio

Leistung

Modus
GPU
Zeit (10 Wörter)

Normal

RTX 3090

~5s

Normal

RTX 4090

~3s

Klein

RTX 3060

~8s

CPU

-

~60s

Vergleich mit anderen TTS

Funktion
Bark
Coqui
Piper

Qualität

Am besten

Großartig

Gut

Geschwindigkeit

Langsam

Mittel

Schnell

Sprachen

13+

20+

30+

Nicht-verbal

Ja

Nein

Nein

VRAM

8GB+

4GB

1GB

Fehlerbehebung

Kein Speicher mehr

Langsame Generierung

  • GPU verwenden (nicht CPU)

  • Modelle zwischen den Generierungen geladen halten

  • Kürzere Segmente erzeugen

Audioqualitätsprobleme

  • Verschiedene Sprecher ausprobieren

  • Langen Text in Sätze aufteilen

  • Sonderzeichen vermeiden

Kostenabschätzung

Typische CLORE.AI-Marktplatztarife (Stand 2024):

GPU
Stundensatz
Tagessatz
4-Stunden-Sitzung

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Preise variieren je nach Anbieter und Nachfrage. Prüfen Sie CLORE.AI Marketplace auf aktuelle Preise.

Geld sparen:

  • Verwenden Sie Spot Markt für flexible Workloads (oft 30–50% günstiger)

  • Bezahlen mit CLORE Token

  • Preise bei verschiedenen Anbietern vergleichen

Nächste Schritte

Zuletzt aktualisiert

War das hilfreich?