SkyReels-V3

Générez de la vidéo à 24 ips avec SkyReels-V3, le modèle vidéo ouvert basé sur Wan2.1 de Kunlun, sur les GPU Clore.ai.

SkyReels-V3 est un modèle de génération vidéo open-source de Kunlun (SkyWork AI) construit sur l'architecture vidéo Wan2.1. Il génère des clips fluides à 24 ips avec des capacités texte-vers-vidéo (T2V) et image-vers-vidéo (I2V). Le modèle hérite de la forte cohérence du mouvement et de la consistance temporelle de Wan2.1 tout en ajoutant les raffinements d'entraînement de SkyWork pour améliorer la qualité visuelle et l'adhérence aux prompts.

Exécuter SkyReels-V3 sur Clore.aiarrow-up-right vous permet d'accéder aux 24 Go de VRAM nécessaires sans acheter de matériel — louez une RTX 4090 pour quelques dollars et commencez à générer.

Principales caractéristiques

  • Sortie 24 ips — fréquence d'images fluide et de qualité broadcast prête à l'emploi.

  • Texte vers Vidéo — générez des clips à partir de descriptions en langage naturel avec un fort respect du prompt.

  • Image vers Vidéo — animez une image de référence avec un mouvement de caméra et un mouvement du sujet contrôlables.

  • Basé sur Wan2.1 — hérite de l'attention temporelle et de la modélisation du mouvement éprouvées de l'architecture Wan.

  • Multi-résolution — prend en charge la génération en 480p et 720p selon le budget VRAM.

  • Poids ouverts — disponible sous licence ouverte pour la recherche et un usage commercial.

  • Chinois + Anglais — prise en charge bilingue des prompts par l'encodeur de texte Wan2.1.

Exigences

Composant
Minimum
Recommandé

VRAM GPU

16 Go (480p avec offload)

24 Go

RAM système

32 Go

64 Go

Disque

25 Go

50 Go

Python

3.10+

3.11

CUDA

12.1+

12.4

Recommandation GPU Clore.ai : Un RTX 4090 (24 Go, ~0,5–2 $/jour) est le bon compromis — assez de VRAM pour la génération 720p en précision complète. Un RTX 3090 (24 Go, ~0,3–1 $/jour) convient pour le 480p et offre le meilleur rapport prix/clip sur la marketplace.

Démarrage rapide

Exemples d'utilisation

Texte vers Vidéo

Image vers Vidéo

Aperçu rapide en basse résolution

Conseils pour les utilisateurs de Clore.ai

  1. Utilisez les classes de pipeline Wan — SkyReels-V3 est architecturally basé sur Wan2.1, donc il utilise WanPipeline / WanImageToVideoPipeline de diffusers.

  2. Commencez en 480p — itérez d'abord sur les prompts à plus basse résolution, puis générez les clips finaux en 720p une fois satisfait de la composition.

  3. Déchargement CPUenable_model_cpu_offload() est recommandé sur les cartes 24 Go pour la génération en 720p afin d'éviter les OOM.

  4. Stockage persistant — définissez HF_HOME=/workspace/hf_cache sur un volume persistant Clore.ai ; le modèle pèse ~15–20 Go.

  5. 24 ips natif — ne changez pas les fps d'exportation ; l'attention temporelle du modèle a été entraînée pour une sortie à 24 ips.

  6. Prompts bilingues — l'encodeur de texte Wan2.1 gère l'anglais et le chinois ; vous pouvez mélanger les langues si nécessaire.

  7. Échelle de guidance — 4.0–6.0 fonctionne le mieux. Des valeurs plus élevées (>8) peuvent provoquer une sursaturation.

  8. tmux est obligatoire — exécutez toujours la génération dans une tmux session sur Clore.ai pour survivre aux déconnexions SSH.

Dépannage

Problème
Corriger

OutOfMemoryError en 720p

Activez pipe.enable_model_cpu_offload(); réduisez à 480p si toujours OOM

Modèle introuvable sur HuggingFace

Vérifiez le nom exact du dépôt sur page HF de SkyworkAIarrow-up-right — il peut être listé sous un nom de variante

Mouvement saccadé ou scintillement

Augmentez num_inference_steps à 40 ; réduisez guidance_scale à 4.0

Génération lente

~1–3 min par clip de 4 secondes sur RTX 4090 est normal pour le 720p ; le 480p est environ 2× plus rapide

Décalage de couleur / sursaturation

Plus bas guidance_scale à 4.0–5.0

ImportError : imageio

pip install imageio[ffmpeg]

Retéléchargement des poids au redémarrage

Montez un stockage persistant et définissez HF_HOME variable d'environnement

Mis à jour

Ce contenu vous a-t-il été utile ?