LivePortrait

Créez des portraits animés réalistes à partir d'images uniques sur Clore.ai

Créez des portraits animés réalistes à partir d'images uniques.

circle-check
circle-info

Tous les exemples de ce guide peuvent être exécutés sur des serveurs GPU loués via Place de marché CLORE.AIarrow-up-right le marketplace.

Location sur CLORE.AI

  1. Filtrer par type de GPU, VRAM et prix

  2. Choisir À la demande (tarif fixe) ou Spot (prix d'enchère)

  3. Configurez votre commande :

    • Sélectionner l'image Docker

    • Définir les ports (TCP pour SSH, HTTP pour les interfaces web)

    • Ajouter des variables d'environnement si nécessaire

    • Entrer la commande de démarrage

  4. Sélectionner le paiement : CLORE, BTC, ou USDT/USDC

  5. Créer la commande et attendre le déploiement

Accéder à votre serveur

  • Trouvez les détails de connexion dans Mes commandes

  • Interfaces web : utilisez l'URL du port HTTP

  • SSH : ssh -p <port> root@<adresse-proxy>

Qu'est-ce que LivePortrait ?

LivePortrait par Kuaishou permet :

  • Animer n'importe quel portrait avec une vidéo de conduite

  • Photo unique vers animation vidéo

  • Transfert d'expression et de pose

  • Inférence compatible en temps réel

Ressources

Matériel recommandé

Composant
Minimum
Recommandé
Optimal

GPU

RTX 3070 8GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

8 Go

16Go

24 Go

CPU

4 cœurs

8 cœurs

16 cœurs

RAM

16Go

32Go

64Go

Stockage

30Go SSD

50Go NVMe

100Go NVMe

Internet

100 Mbps

500 Mbps

1 Gbps

Déploiement rapide sur CLORE.AI

Image Docker :

Ports :

Commande :

Accéder à votre service

Après le déploiement, trouvez votre http_pub URL dans Mes commandes:

  1. Aller à Mes commandes page

  2. Cliquez sur votre commande

  3. Trouvez l' http_pub URL (par ex., abc123.clorecloud.net)

Utilisez https://VOTRE_HTTP_PUB_URL au lieu de localhost dans les exemples ci-dessous.

Installation

Ce que vous pouvez créer

Avatars virtuels

  • Influenceurs IA et présentateurs virtuels

  • Avatars pour le service client

  • Présentateurs éducatifs

Création de contenu

  • Contenu pour les réseaux sociaux

  • Matériel marketing

  • Concepts de clips musicaux

Divertissement

  • Animer des photos historiques

  • Animations de personnages

  • Expériences interactives

Utilisations professionnelles

  • Avatars pour visioconférence

  • Assistants de présentation

  • Simulations de formation

Utilisation de base

Ligne de commande

API Python

Portrait avec contrôle d'expression

Traitement par lot

Interface Gradio

Animation en temps réel via webcam

Intégration avec la synthèse vocale (TTS)

Créer des avatars parlants avec synthèse vocale :

Performances

Résolution
GPU
IPS
Latence

256x256

RTX 3070

30

33 ms

256x256

RTX 4090

60+

16 ms

512x512

RTX 4090

30

33 ms

512x512

A100

45

22 ms

Problèmes courants et solutions

Visage non détecté

Problème : "Aucun visage détecté dans l'image source"

Solutions :

  • Assurez-vous que le visage est clairement visible et de face

  • Utilisez un bon éclairage dans l'image source

  • Recadrez l'image pour vous concentrer sur le visage

  • Taille minimale du visage : 128x128 pixels

Le mouvement ne correspond pas

Problème : L'animation ne suit pas la vidéo de conduite

Solutions :

  • Utilisez des vidéos de conduite avec des mouvements faciaux clairs

  • Assurez-vous que la vidéo de conduite a une orientation de visage similaire

  • Essayez différentes vidéos de conduite

Problèmes de qualité

Problème : La sortie semble floue ou déformée

Solutions :

Latence en temps réel

Problème : L'animation webcam est lente

Solutions :

  • Utilisez une résolution de sortie plus petite (256x256)

  • Activez l'optimisation TensorRT

  • Utilisez une RTX 4090 ou mieux pour le temps réel

Problèmes de synchronisation audio

Problème : Les mouvements des lèvres ne correspondent pas à l'audio

Solutions :

  • Utilisez la génération audio-vers-vidéo de conduite

  • Ajustez le timing de la vidéo en post-traitement

  • Utilisez Wav2Lip pour une meilleure synchronisation labiale

Dépannage

Visage non détecté

  • Assurez-vous que le visage est clairement visible dans la source

  • Utilisez des photos de face

  • Vérifiez la résolution de l'image (512+ recommandé)

L'animation semble non naturelle

  • La source et la vidéo de conduite doivent avoir des angles de visage similaires

  • Évitez les expressions extrêmes dans la vidéo de conduite

  • Utilisez des clips de conduite plus courts

La vidéo de sortie est corrompue

  • Installez ffmpeg : apt install ffmpeg

  • Vérifiez la compatibilité du format de sortie

  • Assurez-vous d'avoir suffisamment d'espace disque

Erreurs CUDA

  • Installez une version de PyTorch compatible

  • Vérifiez que la version CUDA correspond aux exigences

Estimation des coûts

Tarifs typiques du marché CLORE.AI (à partir de 2024) :

GPU
Tarif horaire
Tarif journalier
Session de 4 heures

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Les prix varient selon le fournisseur et la demande. Vérifiez Place de marché CLORE.AIarrow-up-right pour les tarifs actuels.

Économisez de l'argent :

  • Utilisez Spot market pour les charges de travail flexibles (souvent 30-50% moins cher)

  • Payer avec CLORE tokens

  • Comparer les prix entre différents fournisseurs

Étapes suivantes

  • SadTalker - Alternative pour talking head

  • Wav2Lip - Meilleure synchronisation labiale

  • XTTS - Génération vocale

Mis à jour

Ce contenu vous a-t-il été utile ?