RVC Voice Clone

Stimmen klonen und konvertieren mit RVC auf Clore.ai GPUs

Stimmen klonen und umwandeln mit Retrieval-basierter Sprachkonvertierung.

circle-check

Mieten auf CLORE.AI

  1. Nach GPU-Typ, VRAM und Preis filtern

  2. Wählen On-Demand (Festpreis) oder Spot (Gebotspreis)

  3. Konfigurieren Sie Ihre Bestellung:

    • Docker-Image auswählen

    • Ports festlegen (TCP für SSH, HTTP für Web-UIs)

    • Umgebungsvariablen bei Bedarf hinzufügen

    • Startbefehl eingeben

  4. Zahlung auswählen: CLORE, BTC, oder USDT/USDC

  5. Bestellung erstellen und auf Bereitstellung warten

Zugriff auf Ihren Server

  • Verbindungsdetails finden in Meine Bestellungen

  • Web-Oberflächen: Verwenden Sie die HTTP-Port-URL

  • SSH: ssh -p <port> root@<proxy-address>

Was ist RVC?

RVC (Retrieval-basierte Sprachkonvertierung) kann:

  • Jede Stimme mit minimalem Training klonen

  • Gesangs- und Sprechstimmen konvertieren

  • Echtzeit-Sprachkonvertierung

  • Ausgabe in hoher Qualität

Anforderungen

Aufgabe
Min. VRAM
Empfohlen

Inference

4GB

RTX 3060

Training

8GB

RTX 3090

Echtzeit

6GB

RTX 3070

Schnelle Bereitstellung

Docker-Image:

Ports:

Befehl:

Zugriff auf Ihren Dienst

Nach der Bereitstellung finden Sie Ihre http_pub URL in Meine Bestellungen:

  1. Gehen Sie zur Meine Bestellungen Seite

  2. Klicken Sie auf Ihre Bestellung

  3. Finden Sie die http_pub URL (z. B., abc123.clorecloud.net)

Verwenden Sie https://YOUR_HTTP_PUB_URL anstelle von localhost in den folgenden Beispielen.

Installation

Sprachkonvertierung (Inference)

Verwendung der Web-Oberfläche

  1. Öffnen http://<proxy>:7865

  2. Gehen Sie zum Reiter "Model Inference"

  3. Audio-Datei hochladen

  4. Stimmenmodell auswählen

  5. Einstellungen anpassen

  6. Auf "Convert" klicken

Python-API

Eigene Stimme trainieren

Datensatz vorbereiten

  1. 10–30 Minuten sauberes Audio sammeln

  2. In 5–15 Sekunden lange Clips schneiden

  3. Hintergrundgeräusche/Musik entfernen

Training über Web UI

  1. Gehen Sie zum Reiter "Train"

  2. Experimentnamen eingeben

  3. Pfad des Trainingsordners festlegen

  4. Auf "Process data" klicken

  5. Auf "Feature extraction" klicken

  6. Auf "Train" klicken

Training über Kommandozeile

Trainingsparameter

Parameter
Beschreibung
Empfohlen

Abtastrate

Audioqualität

48000

Batch-Größe

Trainingseinheit (Batch)

8-16

Epochen

Trainingsdurchläufe

200-500

Speichere alle

Häufigkeit der Checkpoints

20-50

f0-Methode

Tonhöhenerkennung

rmvpe

F0-Methoden

Methode
Qualität
Geschwindigkeit
Am besten für

pm

OK

Schnell

Testen

harvest

Gut

Langsam

Allgemein

crepe

Großartig

Mittel

Gesang

rmvpe

Am besten

Mittel

Alle

Echtzeit-Konvertierung

Einrichtung

Modellformate

In ONNX konvertieren

Audio-Vorverarbeitung

Rauschreduzierung

Lautstärke normalisieren

Stille entfernen

Batch-Verarbeitung

Gesangs-Stimmenkonvertierung

Für Lieder geeignete Einstellungen verwenden:

Häufige Probleme

Stimme klingt robotic

  • Quell-Audio in höherer Qualität verwenden

  • Protect-Wert erhöhen (0,4–0,5)

  • Andere f0-Methode ausprobieren

Tonhöhen-Probleme

  • f0_up_key anpassen

  • rmvpe als f0-Methode verwenden

  • Für konsistente Tonhöhe in den Trainingsdaten sorgen

Audio-Qualität

  • 48 kHz Abtastrate verwenden

  • Hintergrundgeräusche aus den Trainingsdaten entfernen

  • Mehr Epochen trainieren

API-Server

Trainingstipps

Für bessere Qualität

  • Verwenden Sie 20+ Minuten sauberes Audio

  • Alle Hintergrundgeräusche entfernen

  • Konsistente Mikrofon-/Aufnahme-Einstellungen

  • Verschiedene Ausdrücke/Emotionen einbeziehen

Für schnelleres Training

  • Batch-Größe 8–16 verwenden

  • Mixed Precision aktivieren

  • NVMe-SSD für den Datensatz verwenden

Leistung

Aufgabe
GPU
Zeit

Inference (1 Min. Audio)

RTX 3090

~5s

Training (30 Min. Datensatz)

RTX 3090

~2 Stunden

Echtzeit-Konvertierung

RTX 3070

<50 ms Latenz

Fehlerbehebung

Kostenabschätzung

Typische CLORE.AI-Marktplatzpreise (Stand 2024):

GPU
Stundenpreis
Tagespreis
4-Stunden-Sitzung

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Preise variieren je nach Anbieter und Nachfrage. Prüfen Sie CLORE.AI Marktplatzarrow-up-right für aktuelle Preise.

Geld sparen:

  • Verwenden Sie Spot Markt für flexible Workloads (oft 30–50% günstiger)

  • Mit bezahlen CLORE Tokens

  • Preise verschiedener Anbieter vergleichen

Nächste Schritte

Zuletzt aktualisiert

War das hilfreich?