RVC Voice Clone

Cloner et convertir des voix avec RVC sur les GPU Clore.ai

Cloner et convertir des voix en utilisant la Conversion de Voix basée sur la Récupération.

circle-check

Location sur CLORE.AI

  1. Filtrer par type de GPU, VRAM et prix

  2. Choisir À la demande (tarif fixe) ou Spot (prix d'enchère)

  3. Configurez votre commande :

    • Sélectionner l'image Docker

    • Définir les ports (TCP pour SSH, HTTP pour les interfaces web)

    • Ajouter des variables d'environnement si nécessaire

    • Entrer la commande de démarrage

  4. Sélectionner le paiement : CLORE, BTC, ou USDT/USDC

  5. Créer la commande et attendre le déploiement

Accéder à votre serveur

  • Trouvez les détails de connexion dans Mes commandes

  • Interfaces web : utilisez l'URL du port HTTP

  • SSH : ssh -p <port> root@<adresse-proxy>

Qu'est-ce que RVC ?

RVC (Conversion de Voix basée sur la Récupération) peut :

  • Cloner n'importe quelle voix avec un entraînement minimal

  • Convertir des voix chantées/parlées

  • Conversion de voix en temps réel

  • Sortie de haute qualité

Exigences

Tâche
VRAM min
Recommandé

Inférence

4 Go

RTX 3060

Entraînement

8 Go

RTX 3090

Temps réel

6 Go

RTX 3070

Déploiement rapide

Image Docker :

Ports :

Commande :

Accéder à votre service

Après le déploiement, trouvez votre http_pub URL dans Mes commandes:

  1. Aller à Mes commandes page

  2. Cliquez sur votre commande

  3. Trouvez l' http_pub URL (par ex., abc123.clorecloud.net)

Utilisez https://VOTRE_HTTP_PUB_URL au lieu de localhost dans les exemples ci-dessous.

Installation

Conversion de voix (Inférence)

Utilisation de l'interface Web

  1. Ouvrir http://<proxy>:7865

  2. Aller à l'onglet « Model Inference »

  3. Téléverser un fichier audio

  4. Sélectionner le modèle de voix

  5. Ajuster les paramètres

  6. Cliquer sur « Convert »

API Python

Entraîner une voix personnalisée

Préparer le jeu de données

  1. Collecter 10-30 minutes d'audio propre

  2. Découper en clips de 5 à 15 secondes

  3. Supprimer le bruit de fond/la musique

Entraînement via l'interface Web

  1. Aller à l'onglet « Train »

  2. Entrer le nom de l'expérience

  3. Définir le chemin du dossier d'entraînement

  4. Cliquer sur « Process data »

  5. Cliquer sur « Feature extraction »

  6. Cliquer sur « Train »

Entraînement via la ligne de commande

Paramètres d'entraînement

Paramètre
Description
Recommandé

Taux d'échantillonnage

Qualité audio

48000

Taille de lot

Lot d'entraînement

8-16

Époques

Itérations d'entraînement

200-500

Sauvegarder chaque

Fréquence des checkpoints

20-50

Méthode f0

Extraction de la hauteur

rmvpe

Méthodes f0

Méthode
Qualité
Vitesse
Idéal pour

pm

OK

Rapide

Test

harvest

Bon

Lent

Général

crepe

Excellent

Moyen

Chant

rmvpe

Meilleur

Moyen

Tous

Conversion en temps réel

Configuration

Formats de modèle

Convertir en ONNX

Prétraitement audio

Supprimer le bruit

Normaliser le volume

Supprimer les silences

Traitement par lot

Conversion de voix chantée

Pour les chansons, utilisez les paramètres appropriés :

Problèmes courants

La voix sonne robotique

  • Utiliser une source audio de meilleure qualité

  • Augmenter la valeur de protect (0.4-0.5)

  • Essayer une autre méthode f0

Problèmes de hauteur

  • Ajuster f0_up_key

  • Utiliser la méthode f0 rmvpe

  • Assurer une hauteur cohérente dans les données d'entraînement

Qualité audio

  • Utiliser un taux d'échantillonnage de 48 kHz

  • Supprimer le bruit de fond des données d'entraînement

  • S'entraîner pendant plus d'époques

Serveur API

Conseils d'entraînement

Pour une meilleure qualité

  • Utiliser plus de 20 minutes d'audio propre

  • Supprimer tout bruit de fond

  • Configuration de microphone/enregistrement cohérente

  • Inclure des expressions/émotions variées

Pour un entraînement plus rapide

  • Utiliser une taille de lot de 8-16

  • Activer la précision mixte

  • Utiliser un SSD NVMe pour le jeu de données

Performances

Tâche
GPU
Temps

Inférence (1 min d'audio)

RTX 3090

~5s

Entraînement (jeu de données 30 min)

RTX 3090

~2 heures

Conversion en temps réel

RTX 3070

<50ms de latence

Dépannage

Estimation des coûts

Tarifs typiques du marché CLORE.AI (à partir de 2024) :

GPU
Tarif horaire
Tarif journalier
Session de 4 heures

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Les prix varient selon le fournisseur et la demande. Vérifiez Place de marché CLORE.AIarrow-up-right pour les tarifs actuels.

Économisez de l'argent :

  • Utilisez Spot market pour les charges de travail flexibles (souvent 30-50% moins cher)

  • Payer avec CLORE tokens

  • Comparer les prix entre différents fournisseurs

Étapes suivantes

Mis à jour

Ce contenu vous a-t-il été utile ?