OpenVoice

Klonen Sie jede Stimme mit Sekunden an Audio mithilfe von OpenVoice auf Clore.ai

Klonen Sie jede Stimme mit nur wenigen Sekunden Audio mithilfe von OpenVoice.

circle-check

Mieten auf CLORE.AI

  1. Nach GPU-Typ, VRAM und Preis filtern

  2. Wählen On-Demand (Festpreis) oder Spot (Gebotspreis)

  3. Konfigurieren Sie Ihre Bestellung:

    • Docker-Image auswählen

    • Ports festlegen (TCP für SSH, HTTP für Web-UIs)

    • Umgebungsvariablen bei Bedarf hinzufügen

    • Startbefehl eingeben

  4. Zahlung auswählen: CLORE, BTC, oder USDT/USDC

  5. Bestellung erstellen und auf Bereitstellung warten

Zugriff auf Ihren Server

  • Verbindungsdetails finden Sie in Meine Bestellungen

  • Webschnittstellen: Verwenden Sie die HTTP-Port-URL

  • SSH: ssh -p <port> root@<proxy-address>

Was ist OpenVoice?

OpenVoice von MyShell kann:

  • Stimmen aus ~10 Sekunden Audio klonen

  • Gefühl, Akzent, Rhythmus steuern

  • Cross-linguales Stimmenklonen

  • Zero-Shot-Stimmenkonversion

Anforderungen

Aufgabe
Min. VRAM
Empfohlen

Inference

4GB

RTX 3060

Batch-Verarbeitung

6GB

RTX 3070

Schnelle Bereitstellung

Docker-Image:

Ports:

Befehl:

Zugriff auf Ihren Dienst

Nach der Bereitstellung finden Sie Ihre http_pub URL in Meine Bestellungen:

  1. Gehen Sie zur Meine Bestellungen Seite

  2. Klicken Sie auf Ihre Bestellung

  3. Finden Sie die http_pub URL (z. B., abc123.clorecloud.net)

Verwenden Sie https://IHRE_HTTP_PUB_URL anstelle von localhost in den Beispielen unten.

Installation

Grundlegendes Stimmenklonen

Mit Text-zu-Sprache

Erzeuge Sprache in jeder Stimme:

Mehrsprachige Unterstützung

Emotionssteuerung

OpenVoice V2 unterstützt Emotions-/Stilsteuerung:

Batch-Verarbeitung

API-Server

Qualitätstipps

Für beste Ergebnisse

  • Verwenden Sie 10–30 Sekunden klares Referenzaudio

  • Vermeiden Sie Hintergrundgeräusche

  • Nur ein Sprecher in der Referenz

  • Sprechtempo ungefähr anpassen

Audio-Vorverarbeitung

Vergleich mit anderen Tools

Funktion
OpenVoice
RVC
Bark

Referenzaudio

10-30s

10+ min

N/A

Training

Nicht erforderlich

Erforderlich

N/A

Geschwindigkeit

Schnell

Mittel

Langsam

Qualität

Großartig

Am besten

Gut

Cross-lingual

Ja

Begrenzt

Ja

Leistung

Aufgabe
GPU
Zeit

Embedding extrahieren

RTX 3090

~1s

10s Audio konvertieren

RTX 3090

~2s

1 min Audio konvertieren

RTX 3090

~8s

Fehlerbehebung

Schlechte Stimmenübereinstimmung

  • Verwenden Sie längeres Referenzaudio

  • Stellen Sie klare Audioqualität sicher

  • Überprüfen Sie auf Hintergrundgeräusche

Audio-Artefakte

  • Reduzieren Sie Geschwindigkeit/Betonungs-Einstellungen

  • Verwenden Sie ein konsistentes Audioformat

  • Überprüfen Sie Übereinstimmung der Abtastrate

Kein Speicher mehr

  • Verarbeiten Sie kürzere Clips

  • Batch-Größe reduzieren

  • CUDA-Cache leeren

Kostenabschätzung

Typische CLORE.AI-Marktplatztarife (Stand 2024):

GPU
Stundensatz
Tagessatz
4-Stunden-Sitzung

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Preise variieren je nach Anbieter und Nachfrage. Prüfen Sie CLORE.AI Marketplacearrow-up-right auf aktuelle Preise.

Geld sparen:

  • Verwenden Sie Spot Markt für flexible Workloads (oft 30–50% günstiger)

  • Bezahlen mit CLORE Token

  • Preise bei verschiedenen Anbietern vergleichen

Nächste Schritte

Zuletzt aktualisiert

War das hilfreich?