Stable Video Diffusion

Erzeugen Sie Videos aus Bildern mit Stable Video Diffusion auf Clore.ai

Neuere Alternativen verfügbar! Erwäge FramePack (nur 6GB VRAM!), Wan2.1 (höhere Qualität), oder LTX-2 (Video mit nativer Audioaufnahme).

Erzeuge Videos aus Bildern mit Stability AIs SVD-Modell.

Alle Beispiele können auf GPU-Servern ausgeführt werden, die über CLORE.AI Marketplace.

Was ist Stable Video Diffusion?

SVD (Stable Video Diffusion) erzeugt kurze Videoclips aus einem einzelnen Bild:

Ausgaben mit 14 oder 25 Frames
Auflösung 576x1024
Flüssige Bewegungserzeugung
Open-Source-Gewichte

Ressourcen

HuggingFace: stabilityai/stable-video-diffusion-img2vid-xt
GitHub: Stability-AI/generative-models
Paper: SVD-Paper

Hardware-Anforderungen

Modell

VRAM

Empfohlene GPU

SVD (14 Frames)

16GB

RTX 4090

SVD-XT (25 Frames)

24GB

RTX 4090 / A100

Schnelle Bereitstellung

Docker-Image:

pytorch/pytorch:2.5.1-cuda12.4-cudnn9-devel

Ports:

22/tcp
7860/http

Befehl:

pip install diffusers transformers accelerate && \
pip install gradio && \
python -c "
import gradio as gr
from diffusers import StableVideoDiffusionPipeline
from diffusers.utils import export_to_video
import torch

pipe = StableVideoDiffusionPipeline.from_pretrained(
    'stabilityai/stable-video-diffusion-img2vid-xt',
    torch_dtype=torch.float16,
    variant='fp16'
).to('cuda')

def generate(image, seed, fps):
    generator = torch.manual_seed(seed)
    frames = pipe(image, num_frames=25, generator=generator).frames[0]
    export_to_video(frames, 'output.mp4', fps=fps)
    return 'output.mp4'

gr.Interface(
    fn=generate,
    inputs=[gr.Image(type='pil'), gr.Number(value=42, label='Seed'), gr.Slider(6, 30, value=7, label='FPS')],
    outputs=gr.Video(),
    title='Stable Video Diffusion'
).launch(server_name='0.0.0.0', server_port=7860)
"

Zugriff auf Ihren Dienst

Nach der Bereitstellung finden Sie Ihre http_pub URL in Meine Bestellungen:

Gehen Sie zur Meine Bestellungen Seite
Klicken Sie auf Ihre Bestellung
Finden Sie die http_pub URL (z. B., abc123.clorecloud.net)

Verwenden Sie https://IHRE_HTTP_PUB_URL anstelle von localhost in den Beispielen unten.

Installation

pip install diffusers transformers accelerate torch

# Für Videoexport
pip install imageio[ffmpeg]

Grundlegende Verwendung

import torch
from diffusers import StableVideoDiffusionPipeline
from diffusers.utils import load_image, export_to_video

# Lade Pipeline
pipe = StableVideoDiffusionPipeline.from_pretrained(
    "stabilityai/stable-video-diffusion-img2vid-xt",
    torch_dtype=torch.float16,
    variant="fp16"
)
pipe.to("cuda")

# Lade und ändere Bildgröße
image = load_image("input.jpg")
image = image.resize((1024, 576))

# Generiere Video
generator = torch.manual_seed(42)
frames = pipe(image, num_frames=25, generator=generator).frames[0]

# Video speichern
export_to_video(frames, "output.mp4", fps=7)

SVD vs SVD-XT

Funktion

SVD

SVD-XT

Frames

Dauer

~2 Sek

~3.5 Sek

VRAM

16GB

24GB

Qualität

Gut

Besser

Speicheroptimierung


# Speicher-effiziente Attention aktivieren
pipe.enable_model_cpu_offload()

# Oder Attention Slicing verwenden
pipe.enable_attention_slicing()

# Für sehr wenig VRAM
pipe.enable_sequential_cpu_offload()

Batch-Verarbeitung

import os
from pathlib import Path

input_dir = Path("./images")
output_dir = Path("./videos")
output_dir.mkdir(exist_ok=True)

for img_path in input_dir.glob("*.jpg"):
    image = load_image(str(img_path)).resize((1024, 576))
    frames = pipe(image, num_frames=25).frames[0]
    export_to_video(frames, str(output_dir / f"{img_path.stem}.mp4"), fps=7)
    print(f"Generated: {img_path.stem}.mp4")

ComfyUI-Integration

SVD funktioniert großartig in ComfyUI:

ComfyUI installieren
SVD-Modell herunterladen nach models/checkpoints/
Verwende SVD-Knoten für den img2vid-Workflow

Fehlerbehebung

Kein Speicher mehr

Verwenden Sie enable_model_cpu_offload()
Reduzieren num_frames auf 14
Verwende die fp16-Variante

Video zu kurz

Verwende SVD-XT (25 Frames) statt SVD (14 Frames)
Interpoliere mit RIFE für ein flüssigeres Ergebnis

Schlechte Bewegungsqualität

Verwende hochwertige Eingabebilder
Stelle sicher, dass das Bild 1024x576 (oder 576x1024) ist
Probiere verschiedene Seeds

CUDA-Fehler

Aktualisiere PyTorch und diffusers
Überprüfe die CUDA-Versionskompatibilität

Kostenabschätzung

Typische CLORE.AI-Marktplatztarife (Stand 2024):

GPU

Stundensatz

Tagessatz

4-Stunden-Sitzung

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Preise variieren je nach Anbieter. Prüfe CLORE.AI Marketplace auf aktuelle Preise.

Nächste Schritte

AnimateDiff - SD-Bilder animieren
RIFE-Interpolation - Erhöhe die FPS
Hunyuan Video - Text-zu-Video

VorherigeLTX-Video Echtzeit-Generierung NächsteKI-Video-Generierung

Zuletzt aktualisiert vor 1 Monat

War das hilfreich?

hashtagWas ist Stable Video Diffusion?

hashtagRessourcen

hashtagHardware-Anforderungen

hashtagSchnelle Bereitstellung

hashtagZugriff auf Ihren Dienst

hashtagInstallation

hashtagGrundlegende Verwendung

hashtagSVD vs SVD-XT

hashtagSpeicheroptimierung

hashtagBatch-Verarbeitung

hashtagComfyUI-Integration

hashtagFehlerbehebung

hashtagVideo zu kurz

hashtagSchlechte Bewegungsqualität

hashtagCUDA-Fehler

hashtagKostenabschätzung

hashtagNächste Schritte

Was ist Stable Video Diffusion?

Ressourcen

Hardware-Anforderungen

Schnelle Bereitstellung

Zugriff auf Ihren Dienst

Installation

Grundlegende Verwendung

SVD vs SVD-XT

Speicheroptimierung

Batch-Verarbeitung

ComfyUI-Integration

Fehlerbehebung

Video zu kurz

Schlechte Bewegungsqualität

CUDA-Fehler

Kostenabschätzung

Nächste Schritte