Retrato en vivo

Crea retratos animados realistas a partir de imágenes únicas en Clore.ai

Crea retratos animados realistas a partir de imágenes únicas.

circle-check
circle-info

Todos los ejemplos en esta guía se pueden ejecutar en servidores GPU alquilados a través de CLORE.AI Marketplacearrow-up-right mercado.

Alquiler en CLORE.AI

  1. Filtrar por tipo de GPU, VRAM y precio

  2. Elegir Bajo demanda (tarifa fija) o Spot (precio por puja)

  3. Configure su pedido:

    • Seleccione la imagen de Docker

    • Establezca puertos (TCP para SSH, HTTP para interfaces web)

    • Agregue variables de entorno si es necesario

    • Ingrese el comando de inicio

  4. Seleccione el pago: CLORE, BTC, o USDT/USDC

  5. Cree el pedido y espere el despliegue

Acceda a su servidor

  • Encuentre los detalles de conexión en Mis pedidos

  • Interfaces web: use la URL del puerto HTTP

  • SSH: ssh -p <port> root@<proxy-address>

¿Qué es LivePortrait?

LivePortrait de Kuaishou permite:

  • Animar cualquier retrato con un video conductor

  • De foto única a animación de video

  • Transferencia de expresión y pose

  • Inferencia con capacidad en tiempo real

Recursos

Hardware recomendado

Componente
Mínimo
Recomendado
Óptimo

GPU

RTX 3070 8GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

8GB

16GB

24GB

CPU

4 núcleos

8 núcleos

16 núcleos

RAM

16GB

32GB

64GB

Almacenamiento

30GB SSD

50GB NVMe

100GB NVMe

Internet

100 Mbps

500 Mbps

1 Gbps

Despliegue rápido en CLORE.AI

Imagen de Docker:

Puertos:

Comando:

Accediendo a su servicio

Después del despliegue, encuentre su http_pub URL en Mis pedidos:

  1. Ir a Mis pedidos página

  2. Haga clic en su pedido

  3. Encuentre la http_pub URL (por ejemplo, abc123.clorecloud.net)

Use https://YOUR_HTTP_PUB_URL en lugar de localhost en los ejemplos de abajo.

Instalación

Lo que puedes crear

Avatares virtuales

  • Influencers de IA y presentadores virtuales

  • Avatares para atención al cliente

  • Presentadores educativos

Creación de contenido

  • Contenido para redes sociales

  • Materiales de marketing

  • Conceptos para videos musicales

Entretenimiento

  • Animar fotos históricas

  • Animaciones de personajes

  • Experiencias interactivas

Usos profesionales

  • Avatares para videoconferencias

  • Asistentes de presentaciones

  • Simulaciones de entrenamiento

Uso básico

Línea de comandos

API de Python

Retrato con control de expresiones

Procesamiento por lotes

Interfaz Gradio

Animación en tiempo real con cámara web

Integración con TTS

Crear avatares parlantes con texto a voz:

Rendimiento

Resolución
GPU
FPS
Latencia

256x256

RTX 3070

30

33ms

256x256

RTX 4090

60+

16ms

512x512

RTX 4090

30

33ms

512x512

A100

45

22ms

Problemas comunes y soluciones

Rostro no detectado

Problema: "No se detectó rostro en la imagen fuente"

Soluciones:

  • Asegúrate de que el rostro sea claramente visible y esté de frente

  • Usa buena iluminación en la imagen fuente

  • Recorta la imagen para centrarte en el rostro

  • Tamaño mínimo del rostro: 128x128 píxeles

El movimiento no coincide

Problema: La animación no sigue el video conductor

Soluciones:

  • Usa videos conductores con movimientos faciales claros

  • Asegúrate de que el video conductor tenga una orientación facial similar

  • Prueba con diferentes videos conductores

Problemas de calidad

Problema: La salida se ve borrosa o distorsionada

Soluciones:

Retraso en tiempo real

Problema: La animación de la cámara web tiene lag

Soluciones:

  • Usa una resolución de salida más pequeña (256x256)

  • Habilita la optimización TensorRT

  • Usa RTX 4090 o mejor para tiempo real

Problemas de sincronización de audio

Problema: Los movimientos de los labios no coinciden con el audio

Soluciones:

  • Usa generación de video conductor a partir del audio

  • Ajusta el tiempo del video en postprocesamiento

  • Usa Wav2Lip para mejor sincronización labial

Solución de problemas

Rostro no detectado

  • Asegúrate de que el rostro sea claramente visible en la fuente

  • Usa fotos de frente

  • Verifica la resolución de la imagen (se recomienda 512+)

La animación parece antinatural

  • El video fuente y el conductor deben tener ángulos faciales similares

  • Evita expresiones extremas en el video conductor

  • Usa clips conductores más cortos

Video de salida corrupto

  • Instala ffmpeg: apt install ffmpeg

  • Verifica la compatibilidad del formato de salida

  • Asegúrate de tener suficiente espacio en disco

Errores de CUDA

  • Instala una versión compatible de PyTorch

  • Verifica que la versión de CUDA coincida con los requisitos

Estimación de costos

Tarifas típicas del marketplace de CLORE.AI (a fecha de 2024):

GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Los precios varían según el proveedor y la demanda. Consulte CLORE.AI Marketplacearrow-up-right para las tarifas actuales.

Ahorre dinero:

  • Use Spot mercado para cargas de trabajo flexibles (a menudo 30-50% más barato)

  • Pague con CLORE tokens

  • Compare precios entre diferentes proveedores

Siguientes pasos

  • SadTalker - Cabeza parlante alternativa

  • Wav2Lip - Mejor sincronización labial

  • XTTS - Generación de voz

Última actualización

¿Te fue útil?