OpenVoice

Clonez n'importe quelle voix avec quelques secondes d'audio en utilisant OpenVoice sur Clore.ai

Clonez n'importe quelle voix avec seulement quelques secondes d'audio en utilisant OpenVoice.

circle-check

Location sur CLORE.AI

  1. Filtrer par type de GPU, VRAM et prix

  2. Choisir À la demande (tarif fixe) ou Spot (prix d'enchère)

  3. Configurez votre commande :

    • Sélectionnez l'image Docker

    • Définissez les ports (TCP pour SSH, HTTP pour les interfaces web)

    • Ajoutez des variables d'environnement si nécessaire

    • Entrez la commande de démarrage

  4. Sélectionnez le paiement : CLORE, BTC, ou USDT/USDC

  5. Créez la commande et attendez le déploiement

Accédez à votre serveur

  • Trouvez les détails de connexion dans Mes commandes

  • Interfaces Web : utilisez l'URL du port HTTP

  • SSH : ssh -p <port> root@<adresse-proxy>

Qu'est-ce qu'OpenVoice ?

OpenVoice par MyShell peut :

  • Cloner des voix à partir d'environ 10 secondes d'audio

  • Contrôler l'émotion, l'accent, le rythme

  • Clonage vocal interlingue

  • Conversion vocale zero-shot

Exigences

Tâche
VRAM min
Recommandé

Inférence

4 Go

RTX 3060

Traitement par lots

6 Go

RTX 3070

Déploiement rapide

Image Docker :

Ports :

Commande :

Accéder à votre service

Après le déploiement, trouvez votre http_pub URL dans Mes commandes:

  1. Aller à la Mes commandes page

  2. Cliquez sur votre commande

  3. Trouvez l' http_pub URL (par ex., abc123.clorecloud.net)

Utilisez https://VOTRE_HTTP_PUB_URL au lieu de localhost dans les exemples ci-dessous.

Installation

Clonage vocal basique

Avec synthèse vocale (Text-to-Speech)

Générer la parole dans n'importe quelle voix :

Prise en charge multilingue

Contrôle de l'émotion

OpenVoice V2 prend en charge le contrôle des émotions/styles :

Traitement par lots

Serveur API

Conseils de qualité

Pour de meilleurs résultats

  • Utilisez 10 à 30 secondes d'audio de référence clair

  • Évitez le bruit de fond

  • Référence avec un seul locuteur uniquement

  • Adaptez approximativement le rythme de parole

Prétraitement audio

Comparaison avec d'autres outils

Fonction
OpenVoice
RVC
Bark

Audio de référence

10-30s

10+ min

N/A

Entraînement

Non nécessaire

Requis

N/A

Vitesse

Rapide

Moyen

Lent

Qualité

Excellent

Meilleur

Bon

Interlingue

Oui

Limité

Oui

Performances

Tâche
GPU
Temps

Extraire l'embedding

RTX 3090

~1s

Convertir 10s d'audio

RTX 3090

~2s

Convertir 1 min d'audio

RTX 3090

~8s

Dépannage

Mauvaise correspondance de voix

  • Utiliser un audio de référence plus long

  • Assurer une qualité audio claire

  • Vérifier la présence de bruit de fond

Artefacts audio

  • Réduire les réglages de vitesse/ou d'emphase

  • Utiliser un format audio cohérent

  • Vérifier la correspondance du taux d'échantillonnage

Mémoire insuffisante

  • Traiter des extraits plus courts

  • Réduire la taille de batch

  • Vider le cache CUDA

Estimation des coûts

Tarifs typiques du marché CLORE.AI (à partir de 2024) :

GPU
Tarif horaire
Tarif journalier
Session de 4 heures

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Les prix varient selon le fournisseur et la demande. Vérifiez CLORE.AI Marketplacearrow-up-right pour les tarifs actuels.

Économisez de l'argent :

  • Utilisez Spot market pour les charges de travail flexibles (souvent 30-50 % moins cher)

  • Payer avec CLORE jetons

  • Comparer les prix entre différents fournisseurs

Prochaines étapes

Mis à jour

Ce contenu vous a-t-il été utile ?