SkyReels-V3
Clore.ai GPUs पर Kunlun के Wan2.1-आधारित ओपन वीडियो मॉडल SkyReels-V3 के साथ 24fps वीडियो जेनरेट करें।
SkyReels-V3 Kunlun (SkyWork AI) का एक ओपन‑सोर्स वीडियो जनरेशन मॉडल है जो Wan2.1 वीडियो आर्किटेक्चर पर निर्मित है। यह टेक्स्ट‑टू‑वीडियो (T2V) और इमेज‑टू‑वीडियो (I2V) दोनों क्षमताओं के साथ स्मूद 24 fps क्लिप जेनरेट करता है। मॉडल Wan2.1 की मजबूत मोशन समन्वय और अस्थायी सुसंगति को विरासत में लेता है और बेहतर विज़ुअल गुणवत्ता और प्रॉम्प्ट पालन के लिए SkyWork के प्रशिक्षण परिष्कार जोड़ता है।
SkyReels-V3 को चलाना Clore.ai आपको आवश्यक 24 GB VRAM बिना हार्डवेयर खरीदे एक्सेस करने देता है — RTX 4090 कुछ डॉलर पर किराये पर लें और जनरेशन शुरू करें।
प्रमुख विशेषताएँ
24 fps आउटपुट — बॉक्स से बाहर स्मूद, ब्रॉडकास्ट‑क्वालिटी फ्रेम रेट।
टेक्स्ट-टू-वीडियो — प्राकृतिक भाषा विवरणों से क्लिप जेनरेट करें और प्रॉम्प्ट का अच्छी तरह पालन करें।
इमेज-टू-वीडियो — संदर्भ छवि को नियंत्रित कैमरा मूवमेंट और विषय की गति के साथ एनिमेट करें।
Wan2.1 पर निर्मित — Wan आर्किटेक्चर की सिद्ध अस्थायी अटेंशन और मोशन मॉडलिंग को विरासत में लेता है।
मल्टी‑रिज़ॉल्यूशन — VRAM बजट के अनुसार 480p और 720p पर जेनरेशन का समर्थन करता है।
ओपन वेट्स — शोध और वाणिज्यिक उपयोग के लिए ओपन लाइसेंस के तहत उपलब्ध।
चीनी + अंग्रेजी — Wan2.1 टेक्स्ट एन्कोडर से द्विभाषी प्रॉम्प्ट समर्थन।
आवश्यकताएँ
GPU VRAM
16 GB (ऑफलोड के साथ 480p)
24 GB
सिस्टम RAM
32 GB
64 GB
डिस्क
25 GB
50 GB
Python
3.10+
3.11
CUDA
12.1+
12.4
Clore.ai GPU सिफारिश: एक RTX 4090 (24 GB, ~$0.5–2/दिन) मीठा स्थान है — पूर्ण प्रिसिजन पर 720p जेनरेशन के लिए पर्याप्त VRAM। एक RTX 3090 (24 GB, ~$0.3–1/दिन) 480p के लिए काम करता है और मार्केटप्लेस पर प्रति‑क्लिप सर्वश्रेष्ठ मूल्य‑प्रति‑क्लिप अनुपात पेश करता है।
त्वरित प्रारम्भ
उपयोग के उदाहरण
टेक्स्ट-टू-वीडियो
इमेज-टू-वीडियो
निम्न‑रिज़ॉल्यूशन तेज़ प्रीव्यू
Clore.ai उपयोगकर्ताओं के लिए सुझाव
Wan पाइपलाइन क्लासेस का उपयोग करें — SkyReels-V3 आर्किटेक्चरल रूप से Wan2.1 पर आधारित है, इसलिए यह उपयोग करता है
WanPipeline/WanImageToVideoPipelinediffusers से।480p से शुरू करें — पहले निचली रिज़ॉल्यूशन पर प्रॉम्प्ट के साथ इटरेट करें, फिर कंपोज़िशन से संतुष्ट होने पर अंतिम क्लिप 720p पर जेनरेट करें।
CPU ऑफलोडिंग —
enable_model_cpu_offload()720p जेनरेशन के लिए 24 GB कार्ड पर OOM से बचने के लिए अनुशंसित है।स्थायी स्टोरेज — सेट करें
HF_HOME=/workspace/hf_cacheClore.ai पर एक पर्सिस्टेंट वॉल्यूम पर; मॉडल का वजन ~15–20 GB है।24 fps नेटिव — एक्सपोर्ट fps मत बदलें; मॉडल की अस्थायी अटेंशन 24 fps आउटपुट के लिए प्रशिक्षित थी।
द्विभाषी प्रॉम्प्ट — Wan2.1 टेक्स्ट एन्कोडर अंग्रेजी और चीनी दोनों संभालता है; यदि आवश्यक हो तो आप भाषाओं को मिश्रित कर सकते हैं।
Guidance स्केल — 4.0–6.0 सबसे अच्छा काम करता है। अधिक मान (>8) ओवरसैचुरेशन पैदा कर सकते हैं।
tmux अनिवार्य है — जेनरेशन हमेशा एक
tmuxClore.ai पर सेशन में चलाएं ताकि SSH डिस्कनेक्ट्स से बचा जा सके।
समस्याओं का निवारण
OutOfMemoryError 720p पर
सक्षम करें pipe.enable_model_cpu_offload(); यदि अभी भी OOM है तो 480p पर घटाएँ
मॉडल HuggingFace पर नहीं मिला
सटीक रिपो नाम की जांच करें SkyworkAI HF पेज — यह किसी वैरिएंट नाम के तहत सूचीबद्ध हो सकता है
कंपकंपी या झिलमिलाती गति
बढ़ाएँ num_inference_steps को 40 तक; घटाएँ guidance_scale को 4.0 तक
धीमी जनरेशन
RTX 4090 पर 720p के लिए ~4‑सेकंड क्लिप पर ~1–3 मिनट सामान्य है; 480p लगभग 2× तेज़ है
रंग परिवर्तन / ओवरसैचुरेशन
कम करें guidance_scale को 4.0–5.0 तक
ImportError: imageio
pip install imageio[ffmpeg]
रीस्टार्ट पर वेट्स फिर से डाउनलोड हो रहे हैं
पर्सिस्टेंट स्टोरेज माउंट करें और सेट करें HF_HOME पर्यावरण परिवर्तनीय
Last updated
Was this helpful?