SadTalker

Erstellen Sie Talking-Head-Videos aus Audio und Bildern auf Clore.ai

Animieren Sie Gesichter mit Audio, um realistische sprechende Kopfvideos zu erstellen.

circle-check

Mieten auf CLORE.AI

  1. Nach GPU-Typ, VRAM und Preis filtern

  2. Wählen On-Demand (fester Tarif) oder Spot (Gebotspreis)

  3. Konfigurieren Sie Ihre Bestellung:

    • Docker-Image auswählen

    • Ports festlegen (TCP für SSH, HTTP für Web-UIs)

    • Bei Bedarf Umgebungsvariablen hinzufügen

    • Startbefehl eingeben

  4. Zahlung auswählen: CLORE, BTC, oder USDT/USDC

  5. Bestellung erstellen und auf Bereitstellung warten

Zugriff auf Ihren Server

  • Verbindungsdetails finden in Meine Bestellungen

  • Weboberflächen: Verwenden Sie die HTTP-Port-URL

  • SSH: ssh -p <port> root@<proxy-address>

Was ist SadTalker?

SadTalker erzeugt sprechende Videos:

  • Lippensynchronisation von beliebigem Audio

  • Natürliche Kopfbewegungen

  • Funktioniert mit einem einzelnen Bild

  • Ausdruckskontrolle

Anforderungen

Modus
VRAM
Empfohlen

Basic

4GB

RTX 3060

Hohe Qualität

6GB

RTX 3080

Ganzes Gesicht

8GB

RTX 4080

Schnelle Bereitstellung

Docker-Image:

Ports:

Befehl:

Zugriff auf Ihren Dienst

Nach der Bereitstellung finden Sie Ihre http_pub URL in Meine Bestellungen:

  1. Gehen Sie zu Meine Bestellungen Seite

  2. Klicken Sie auf Ihre Bestellung

  3. Finden Sie die http_pub URL (z. B. abc123.clorecloud.net)

Verwenden Sie https://IHRE_HTTP_PUB_URL anstatt localhost in den Beispielen unten.

Installation

Grundlegende Verwendung

Befehlszeile

Python-API

Mit Gesichtsverbesserung

Parameter

Pose-Stile

Bereich
Effekt

0-5

Subtile Bewegungen

6-20

Normale Bewegungen

21-46

Ausdrucksstarke Bewegungen

Stapelverarbeitung

Gradio-Oberfläche

API-Server

Text-to-Speech + SadTalker

Komplette Pipeline:

Ausdruckskontrolle

Qualitätseinstellungen

Einstellung
Geschwindigkeit
Qualität

Kein Enhancer, 256px

Schnell

Basic

GFPGAN, 256px

Mittel

Gut

GFPGAN, 512px

Langsam

Besser

RealESRGAN, 512px

Langsamste

Am besten

Vorverarbeitungsoptionen

Fehlerbehebung

Gesicht nicht erkannt

  • Verwenden Sie ein klares, frontales Gesichtsbild

  • Gute Beleuchtung

  • Vermeiden Sie Verdeckungen (Brille, Haare)

Audio-Synchronisationsprobleme

  • Verwenden Sie 16-kHz-WAV-Dateien

  • Hintergrundmusik vermeiden

  • Nur klare Sprache

Ruckartige Bewegung

  • Erhöhen Sie den expression_scale leicht

  • Probieren Sie einen anderen pose_style

  • Verwenden Sie längeres Audio

Kein Speicher mehr

  • Reduzieren Sie die Ausgabengröße

  • Deaktivieren Sie den Enhancer

  • Verwenden Sie crop-Vorverarbeitung

Leistung

Auflösung
GPU
Zeit (10s Video)

256px

RTX 3060

~30s

256px

RTX 4090

~15s

512px + GFPGAN

RTX 4090

~45s

Kostenabschätzung

Typische CLORE.AI-Marktplatztarife (Stand 2024):

GPU
Stundensatz
Tagessatz
4-Stunden-Session

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Preise variieren je nach Anbieter und Nachfrage. Prüfen Sie CLORE.AI Marktplatzarrow-up-right für aktuelle Tarife.

Geld sparen:

  • Verwenden Sie Spot Markt für flexible Arbeitslasten (oft 30–50% günstiger)

  • Bezahlen mit CLORE Token

  • Preise bei verschiedenen Anbietern vergleichen

Nächste Schritte

Zuletzt aktualisiert

War das hilfreich?