Wav2Lip

Synchronisation labiale précise sur n'importe quel audio avec Wav2Lip sur les GPU Clore.ai

Synchronisez les lèvres avec n'importe quel audio avec Wav2Lip.

circle-check

Location sur CLORE.AI

  1. Filtrer par type de GPU, VRAM et prix

  2. Choisir À la demande (tarif fixe) ou Spot (prix d'enchère)

  3. Configurez votre commande :

    • Sélectionnez l'image Docker

    • Définissez les ports (TCP pour SSH, HTTP pour les interfaces web)

    • Ajoutez des variables d'environnement si nécessaire

    • Entrez la commande de démarrage

  4. Sélectionnez le paiement : CLORE, BTC, ou USDT/USDC

  5. Créez la commande et attendez le déploiement

Accédez à votre serveur

  • Trouvez les détails de connexion dans Mes commandes

  • Interfaces Web : utilisez l'URL du port HTTP

  • SSH : ssh -p <port> root@<adresse-proxy>

Qu'est-ce que Wav2Lip ?

Wav2Lip fournit :

  • Synchronisation labiale précise pour n'importe quel visage

  • Fonctionne avec n'importe quel audio

  • Entrée vidéo ou image

  • Capable de fonctionner en temps réel

Exigences

Mode
VRAM
Recommandé

Basique

4 Go

RTX 3060

Haute qualité

6 Go

RTX 3080

HD

8 Go

RTX 4080

Déploiement rapide

Image Docker :

Ports :

Commande :

Accéder à votre service

Après le déploiement, trouvez votre http_pub URL dans Mes commandes:

  1. Aller à la Mes commandes page

  2. Cliquez sur votre commande

  3. Trouvez l' http_pub URL (par ex., abc123.clorecloud.net)

Utilisez https://VOTRE_HTTP_PUB_URL au lieu de localhost dans les exemples ci-dessous.

Installation

Utilisation de base

Ligne de commande

Avec entrée image

API Python

Options de qualité

Qualité standard (plus rapide)

Haute qualité (GAN)

Paramètres

Conseils pour le padding

Position du visage
Pads recommandés

Centré

0 10 0 0

Gros plan

0 15 0 0

Loin

0 5 0 0

Traitement par lots

Interface Gradio

Serveur API

Pipeline TTS + Wav2Lip

Texte complet en vidéo :

Post-traitement

Augmenter la résolution du résultat

Ajouter l'audio

Dépannage

Visage non détecté

  • Assurez-vous que le visage est clairement visible

  • Bonne éclairage

  • De face de préférence

  • Entrée en résolution plus élevée

Mauvaise qualité de synchronisation

  • Utilisez wav2lip_gan.pth

  • Ajustez le padding

  • Vérifiez la fréquence d'échantillonnage audio (16 kHz recommandé)

Sortie saccadée

  • Augmentez le resize_factor

  • Désactivez nosmooth

  • Utilisez une vidéo d'entrée de meilleure qualité

Performances

Entrée
GPU
Temps de traitement

vidéo de 10 s

RTX 3060

~30s

vidéo de 10 s

RTX 4090

~15s

vidéo de 30 s

RTX 4090

~45s

Image + audio de 10 s

RTX 3090

~20s

Comparaison avec SadTalker

Fonction
Wav2Lip
SadTalker

Précision des lèvres

Excellent

Bon

Mouvement de la tête

Aucune

Naturel

Expression

Aucune

Contrôlable

Vitesse

Plus rapide

Plus lent

Meilleur pour

Doublage

Avatar

Estimation des coûts

Tarifs typiques du marché CLORE.AI (à partir de 2024) :

GPU
Tarif horaire
Tarif journalier
Session de 4 heures

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Les prix varient selon le fournisseur et la demande. Vérifiez CLORE.AI Marketplacearrow-up-right pour les tarifs actuels.

Économisez de l'argent :

  • Utilisez Spot market pour les charges de travail flexibles (souvent 30-50 % moins cher)

  • Payer avec CLORE jetons

  • Comparer les prix entre différents fournisseurs

Prochaines étapes

Mis à jour

Ce contenu vous a-t-il été utile ?