LivePortrait

Создавайте реалистичные анимированные портреты из одиночных изображений на Clore.ai

Создавайте реалистичные анимированные портреты из одиночных изображений.

circle-check
circle-info

Все примеры в этом руководстве можно запустить на GPU-серверах, арендуемых через CLORE.AI Маркетплейсarrow-up-right маркетплейс.

Аренда на CLORE.AI

  1. Фильтруйте по типу GPU, объёму VRAM и цене

  2. Выберите По запросу (фиксированная ставка) или Спот (цена заявки)

  3. Настройте заказ:

    • Выберите Docker-образ

    • Установите порты (TCP для SSH, HTTP для веб-интерфейсов)

    • При необходимости добавьте переменные окружения

    • Введите команду запуска

  4. Выберите способ оплаты: CLORE, BTC, или USDT/USDC

  5. Создайте заказ и дождитесь развертывания

Доступ к вашему серверу

  • Найдите данные для подключения в Мои заказы

  • Веб-интерфейсы: используйте URL HTTP-порта

  • SSH: ssh -p <порт> root@<proxy-address>

Что такое LivePortrait?

LivePortrait от Kuaishou позволяет:

  • Анимировать любой портрет с помощью управляющего видео

  • Преобразование одной фотографии в анимированное видео

  • Передача выражения и позы

  • Инференс, способный работать в реальном времени

Ресурсы

Рекомендованное оборудование

Компонент
Минимум
Рекомендуется
Оптимально

GPU

RTX 3070 8GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

8GB

16GB

24 ГБ

CPU

4 ядра

8 ядер

16 ядер

ОЗУ

16GB

32GB

64GB

Хранилище

30GB SSD

50GB NVMe

100GB NVMe

Интернет

100 Мбит/с

500 Мбит/с

1 Гбит/с

Быстрое развертывание на CLORE.AI

Docker-образ:

Порты:

Команда:

Доступ к вашему сервису

После развертывания найдите ваш http_pub URL в Мои заказы:

  1. Перейдите на Мои заказы страницу

  2. Нажмите на ваш заказ

  3. Найдите http_pub URL (например, abc123.clorecloud.net)

Используйте https://YOUR_HTTP_PUB_URL вместо localhost в примерах ниже.

Установка

Что вы можете создать

Виртуальные аватары

  • AI-инфлюенсеры и виртуальные ведущие

  • Аватары для обслуживания клиентов

  • Образовательные ведущие

Создание контента

  • Контент для социальных сетей

  • Маркетинговые материалы

  • Концепции музыкальных видео

Развлечения

  • Анимировать исторические фотографии

  • Анимация персонажей

  • Интерактивные развлечения

Профессиональное использование

  • Аватары для видеоконференций

  • Ассистенты для презентаций

  • Тренировочные симуляции

Базовое использование

Командная строка

Python API

Портрет с управлением выражением

Пакетная обработка

Интерфейс Gradio

Анимация в реальном времени через веб-камеру

Интеграция с TTS

Создавайте говорящие аватары с преобразованием текста в речь:

Производительность

Разрешение
GPU
FPS
Задержка

256x256

RTX 3070

30

33 мс

256x256

RTX 4090

60+

16 мс

512x512

RTX 4090

30

33 мс

512x512

A100

45

22 мс

Распространённые проблемы и решения

Лицо не обнаружено

Проблема: "В исходном изображении не обнаружено лицо"

Решения:

  • Убедитесь, что лицо четко видно и обращено вперед

  • Используйте хорошее освещение на исходном изображении

  • Обрежьте изображение, чтобы сосредоточиться на лице

  • Минимальный размер лица: 128x128 пикселей

Движение не соответствует

Проблема: Анимация не повторяет управляющее видео

Решения:

  • Используйте управляющие видео с четкими движениями лица

  • Убедитесь, что в управляющем видео аналогичная ориентация лица

  • Попробуйте другие управляющие видео

Проблемы с качеством

Проблема: Выход выглядит размытым или искаженным

Решения:

Задержка в реальном времени

Проблема: Анимация с веб-камеры лагает

Решения:

  • Используйте меньшее выходное разрешение (256x256)

  • Включите оптимизацию TensorRT

  • Используйте RTX 4090 или лучше для реального времени

Проблемы синхронизации аудио

Проблема: Движения губ не совпадают с аудио

Решения:

  • Используйте генерацию управляющего видео из аудио

  • Отрегулируйте время видео в постобработке

  • Используйте Wav2Lip для лучшей синхронизации губ

Устранение неполадок

Лицо не обнаружено

  • Убедитесь, что лицо четко видно на исходном изображении

  • Используйте фотографии, где лицо направлено вперед

  • Проверьте разрешение изображения (рекомендуется 512+)

Анимация выглядит неестественно

  • Исходное изображение и управляющее видео должны иметь похожие углы лица

  • Избегайте экстремальных выражений в управляющем видео

  • Используйте более короткие управляющие клипы

Выходное видео повреждено

  • Установите ffmpeg: apt install ffmpeg

  • Проверьте совместимость формата вывода

  • Убедитесь, что на диске достаточно места

Ошибка CUDA

  • Установите совместимую версию PyTorch

  • Проверьте, что версия CUDA соответствует требованиям

Оценка стоимости

Типичные ставки на маркетплейсе CLORE.AI (по состоянию на 2024):

GPU
Почасовая ставка
Дневная ставка
Сессия 4 часа

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Цены варьируются в зависимости от провайдера и спроса. Проверьте CLORE.AI Маркетплейсarrow-up-right для текущих тарифов.

Экономьте деньги:

  • Используйте Спот market для гибких нагрузок (часто на 30–50% дешевле)

  • Платите с помощью CLORE токенов

  • Сравнивайте цены у разных провайдеров

Следующие шаги

  • SadTalker - Альтернативный talking head

  • Wav2Lip - Лучшая синхронизация губ

  • XTTS - Генерация голоса

Последнее обновление

Это было полезно?