SkyReels-V3
Générez de la vidéo à 24 ips avec SkyReels-V3, le modèle vidéo ouvert basé sur Wan2.1 de Kunlun, sur les GPU Clore.ai.
SkyReels-V3 est un modèle de génération vidéo open-source de Kunlun (SkyWork AI) construit sur l'architecture vidéo Wan2.1. Il génère des clips fluides à 24 ips avec des capacités texte-vers-vidéo (T2V) et image-vers-vidéo (I2V). Le modèle hérite de la forte cohérence du mouvement et de la consistance temporelle de Wan2.1 tout en ajoutant les raffinements d'entraînement de SkyWork pour améliorer la qualité visuelle et l'adhérence aux prompts.
Exécuter SkyReels-V3 sur Clore.ai vous permet d'accéder aux 24 Go de VRAM nécessaires sans acheter de matériel — louez une RTX 4090 pour quelques dollars et commencez à générer.
Principales caractéristiques
Sortie 24 ips — fréquence d'images fluide et de qualité broadcast prête à l'emploi.
Texte vers Vidéo — générez des clips à partir de descriptions en langage naturel avec un fort respect du prompt.
Image vers Vidéo — animez une image de référence avec un mouvement de caméra et un mouvement du sujet contrôlables.
Basé sur Wan2.1 — hérite de l'attention temporelle et de la modélisation du mouvement éprouvées de l'architecture Wan.
Multi-résolution — prend en charge la génération en 480p et 720p selon le budget VRAM.
Poids ouverts — disponible sous licence ouverte pour la recherche et un usage commercial.
Chinois + Anglais — prise en charge bilingue des prompts par l'encodeur de texte Wan2.1.
Exigences
VRAM GPU
16 Go (480p avec offload)
24 Go
RAM système
32 Go
64 Go
Disque
25 Go
50 Go
Python
3.10+
3.11
CUDA
12.1+
12.4
Recommandation GPU Clore.ai : Un RTX 4090 (24 Go, ~0,5–2 $/jour) est le bon compromis — assez de VRAM pour la génération 720p en précision complète. Un RTX 3090 (24 Go, ~0,3–1 $/jour) convient pour le 480p et offre le meilleur rapport prix/clip sur la marketplace.
Démarrage rapide
Exemples d'utilisation
Texte vers Vidéo
Image vers Vidéo
Aperçu rapide en basse résolution
Conseils pour les utilisateurs de Clore.ai
Utilisez les classes de pipeline Wan — SkyReels-V3 est architecturally basé sur Wan2.1, donc il utilise
WanPipeline/WanImageToVideoPipelinede diffusers.Commencez en 480p — itérez d'abord sur les prompts à plus basse résolution, puis générez les clips finaux en 720p une fois satisfait de la composition.
Déchargement CPU —
enable_model_cpu_offload()est recommandé sur les cartes 24 Go pour la génération en 720p afin d'éviter les OOM.Stockage persistant — définissez
HF_HOME=/workspace/hf_cachesur un volume persistant Clore.ai ; le modèle pèse ~15–20 Go.24 ips natif — ne changez pas les fps d'exportation ; l'attention temporelle du modèle a été entraînée pour une sortie à 24 ips.
Prompts bilingues — l'encodeur de texte Wan2.1 gère l'anglais et le chinois ; vous pouvez mélanger les langues si nécessaire.
Échelle de guidance — 4.0–6.0 fonctionne le mieux. Des valeurs plus élevées (>8) peuvent provoquer une sursaturation.
tmux est obligatoire — exécutez toujours la génération dans une
tmuxsession sur Clore.ai pour survivre aux déconnexions SSH.
Dépannage
OutOfMemoryError en 720p
Activez pipe.enable_model_cpu_offload(); réduisez à 480p si toujours OOM
Modèle introuvable sur HuggingFace
Vérifiez le nom exact du dépôt sur page HF de SkyworkAI — il peut être listé sous un nom de variante
Mouvement saccadé ou scintillement
Augmentez num_inference_steps à 40 ; réduisez guidance_scale à 4.0
Génération lente
~1–3 min par clip de 4 secondes sur RTX 4090 est normal pour le 720p ; le 480p est environ 2× plus rapide
Décalage de couleur / sursaturation
Plus bas guidance_scale à 4.0–5.0
ImportError : imageio
pip install imageio[ffmpeg]
Retéléchargement des poids au redémarrage
Montez un stockage persistant et définissez HF_HOME variable d'environnement
Mis à jour
Ce contenu vous a-t-il été utile ?