SkyReels-V3

Clore.ai GPUs पर Kunlun के Wan2.1-आधारित ओपन वीडियो मॉडल SkyReels-V3 के साथ 24fps वीडियो जेनरेट करें।

SkyReels-V3 Kunlun (SkyWork AI) का एक ओपन‑सोर्स वीडियो जनरेशन मॉडल है जो Wan2.1 वीडियो आर्किटेक्चर पर निर्मित है। यह टेक्स्ट‑टू‑वीडियो (T2V) और इमेज‑टू‑वीडियो (I2V) दोनों क्षमताओं के साथ स्मूद 24 fps क्लिप जेनरेट करता है। मॉडल Wan2.1 की मजबूत मोशन समन्वय और अस्थायी सुसंगति को विरासत में लेता है और बेहतर विज़ुअल गुणवत्ता और प्रॉम्प्ट पालन के लिए SkyWork के प्रशिक्षण परिष्कार जोड़ता है।

SkyReels-V3 को चलाना Clore.aiarrow-up-right आपको आवश्यक 24 GB VRAM बिना हार्डवेयर खरीदे एक्सेस करने देता है — RTX 4090 कुछ डॉलर पर किराये पर लें और जनरेशन शुरू करें।

प्रमुख विशेषताएँ

  • 24 fps आउटपुट — बॉक्स से बाहर स्मूद, ब्रॉडकास्ट‑क्वालिटी फ्रेम रेट।

  • टेक्स्ट-टू-वीडियो — प्राकृतिक भाषा विवरणों से क्लिप जेनरेट करें और प्रॉम्प्ट का अच्छी तरह पालन करें।

  • इमेज-टू-वीडियो — संदर्भ छवि को नियंत्रित कैमरा मूवमेंट और विषय की गति के साथ एनिमेट करें।

  • Wan2.1 पर निर्मित — Wan आर्किटेक्चर की सिद्ध अस्थायी अटेंशन और मोशन मॉडलिंग को विरासत में लेता है।

  • मल्टी‑रिज़ॉल्यूशन — VRAM बजट के अनुसार 480p और 720p पर जेनरेशन का समर्थन करता है।

  • ओपन वेट्स — शोध और वाणिज्यिक उपयोग के लिए ओपन लाइसेंस के तहत उपलब्ध।

  • चीनी + अंग्रेजी — Wan2.1 टेक्स्ट एन्कोडर से द्विभाषी प्रॉम्प्ट समर्थन।

आवश्यकताएँ

घटक
न्यूनतम
अनुशंसित

GPU VRAM

16 GB (ऑफलोड के साथ 480p)

24 GB

सिस्टम RAM

32 GB

64 GB

डिस्क

25 GB

50 GB

Python

3.10+

3.11

CUDA

12.1+

12.4

Clore.ai GPU सिफारिश: एक RTX 4090 (24 GB, ~$0.5–2/दिन) मीठा स्थान है — पूर्ण प्रिसिजन पर 720p जेनरेशन के लिए पर्याप्त VRAM। एक RTX 3090 (24 GB, ~$0.3–1/दिन) 480p के लिए काम करता है और मार्केटप्लेस पर प्रति‑क्लिप सर्वश्रेष्ठ मूल्य‑प्रति‑क्लिप अनुपात पेश करता है।

त्वरित प्रारम्भ

उपयोग के उदाहरण

टेक्स्ट-टू-वीडियो

इमेज-टू-वीडियो

निम्न‑रिज़ॉल्यूशन तेज़ प्रीव्यू

Clore.ai उपयोगकर्ताओं के लिए सुझाव

  1. Wan पाइपलाइन क्लासेस का उपयोग करें — SkyReels-V3 आर्किटेक्चरल रूप से Wan2.1 पर आधारित है, इसलिए यह उपयोग करता है WanPipeline / WanImageToVideoPipeline diffusers से।

  2. 480p से शुरू करें — पहले निचली रिज़ॉल्यूशन पर प्रॉम्प्ट के साथ इटरेट करें, फिर कंपोज़िशन से संतुष्ट होने पर अंतिम क्लिप 720p पर जेनरेट करें।

  3. CPU ऑफलोडिंगenable_model_cpu_offload() 720p जेनरेशन के लिए 24 GB कार्ड पर OOM से बचने के लिए अनुशंसित है।

  4. स्थायी स्टोरेज — सेट करें HF_HOME=/workspace/hf_cache Clore.ai पर एक पर्सिस्टेंट वॉल्यूम पर; मॉडल का वजन ~15–20 GB है।

  5. 24 fps नेटिव — एक्सपोर्ट fps मत बदलें; मॉडल की अस्थायी अटेंशन 24 fps आउटपुट के लिए प्रशिक्षित थी।

  6. द्विभाषी प्रॉम्प्ट — Wan2.1 टेक्स्ट एन्कोडर अंग्रेजी और चीनी दोनों संभालता है; यदि आवश्यक हो तो आप भाषाओं को मिश्रित कर सकते हैं।

  7. Guidance स्केल — 4.0–6.0 सबसे अच्छा काम करता है। अधिक मान (>8) ओवरसैचुरेशन पैदा कर सकते हैं।

  8. tmux अनिवार्य है — जेनरेशन हमेशा एक tmux Clore.ai पर सेशन में चलाएं ताकि SSH डिस्कनेक्ट्स से बचा जा सके।

समस्याओं का निवारण

समस्या
समाधान

OutOfMemoryError 720p पर

सक्षम करें pipe.enable_model_cpu_offload(); यदि अभी भी OOM है तो 480p पर घटाएँ

मॉडल HuggingFace पर नहीं मिला

सटीक रिपो नाम की जांच करें SkyworkAI HF पेजarrow-up-right — यह किसी वैरिएंट नाम के तहत सूचीबद्ध हो सकता है

कंपकंपी या झिलमिलाती गति

बढ़ाएँ num_inference_steps को 40 तक; घटाएँ guidance_scale को 4.0 तक

धीमी जनरेशन

RTX 4090 पर 720p के लिए ~4‑सेकंड क्लिप पर ~1–3 मिनट सामान्य है; 480p लगभग 2× तेज़ है

रंग परिवर्तन / ओवरसैचुरेशन

कम करें guidance_scale को 4.0–5.0 तक

ImportError: imageio

pip install imageio[ffmpeg]

रीस्टार्ट पर वेट्स फिर से डाउनलोड हो रहे हैं

पर्सिस्टेंट स्टोरेज माउंट करें और सेट करें HF_HOME पर्यावरण परिवर्तनीय

Last updated

Was this helpful?