LTX-Video रीयल-टाइम जनरेशन
Clore.ai GPUs पर Lightricks के LTX-Video के साथ वास्तविक-समय से तेज़ 5-सेकंड वीडियो जेनरेट करें।
LTX-Video by Lightricks सबसे तेज़ ओपन-सोर्स वीडियो जनरेशन मॉडल है। एक RTX 4090 पर यह लगभग 4 सेकंड में 5-सेकंड का 768×512 क्लिप उत्पन्न करता है — वास्तविक-समय प्लेबैक से तेज। मॉडल टेक्स्ट-टू-वीडियो (T2V) और इमेज-टू-वीडियो (I2V) वर्कफ़्लो दोनों के लिए नेटिव के माध्यम से समर्थन करता है diffusers इंटीग्रेशन द्वारा LTXPipeline और LTXImageToVideoPipeline.
GPU किराए पर लेना Clore.ai आपको LTX-Video को आवश्यक हार्डवेयर का तात्कालिक एक्सेस देता है, बिना अग्रिम निवेश और प्रति-घंटा बिलिंग के।
प्रमुख विशेषताएँ
वास्तविक-समय से तेज — RTX 4090 पर ~4 सेकंड में 5-सेकंड वीडियो जनरेट किया गया।
टेक्स्ट-टू-वीडियो — प्राकृतिक भाषा विवरणों से क्लिप उत्पन्न करें।
इमेज-टू-वीडियो — एक स्थिर संदर्भ छवि को गति और कैमरा नियंत्रण के साथ एनिमेट करें।
हल्का आर्किटेक्चर — कॉम्पैक्ट लेटेंट स्पेस के साथ 2B पैरामीटर वीडियो DiT।
नेटिव diffusers —
LTXPipelineऔरLTXImageToVideoPipelineमेंdiffusers >= 0.32.ओपन वेट्स — Apache-2.0 लाइसेंस; पूर्ण वाणिज्यिक उपयोग की अनुमति है।
टेम्पोरल VAE — स्थान और समय में 1:192 संपीड़न अनुपात; कुशल डिकोडिंग।
आवश्यकताएँ
GPU VRAM
16 GB
24 GB
सिस्टम RAM
16 GB
32 GB
डिस्क
15 GB
30 GB
Python
3.10+
3.11
CUDA
12.1+
12.4
diffusers
0.32+
नवीनतम
Clore.ai GPU सिफारिश: एक RTX 4090 (24 GB, ~$0.5–2/दिन) अधिकतम थ्रूपुट के लिए आदर्श है। एक RTX 3090 (24 GB, ~$0.3–1/दिन) तब भी कई प्रतिस्पर्धी मॉडलों की तुलना में बहुत कम लागत पर तेज़ चलता है।
त्वरित प्रारम्भ
उपयोग के उदाहरण
टेक्स्ट-टू-वीडियो
इमेज-टू-वीडियो
बैच जनरेशन स्क्रिप्ट
Clore.ai उपयोगकर्ताओं के लिए सुझाव
स्पीड बेंचमार्क — RTX 4090 पर, LTX-Video ~4 सेकंड में 121 फ्रेम जनरेट करता है; इसे एक सत्यापन के रूप में उपयोग करें कि आपकी रेंटल सही तरीके से प्रदर्शन कर रही है।
bf16 प्रिसिशन — चेकपॉइंट bf16 में प्रशिक्षित है; fp16 पर स्विच न करें अन्यथा आप गुणवत्ता में गिरावट का जोखिम उठाएंगे।
वेट्स को कैश करें — सेट करें
HF_HOME=/workspace/hf_cacheएक परसिस्टेंट वॉल्यूम पर। मॉडल ~6 GB है; हर कंटेनर स्टार्ट पर फिर से डाउनलोड करना समय बर्बाद करता है।प्रॉम्प्ट इंजीनियरिंग — LTX-Video सिनेमाई भाषा पर अच्छी प्रतिक्रिया देता है: "drone shot", "slow motion", "golden hour", "tracking shot"। कैमरा मूवमेंट के बारे में विशिष्ट रहें।
रात भर बैच — LTX-Video एक 4090 पर प्रति घंटे सैकड़ों क्लिप जनरेट करने के लिए तेज़ है। प्रॉम्प्ट्स को फ़ाइल से कतारबद्ध करें और इसे चलने दें।
SSH + tmux — हमेशा जनरेशन को एक
tmuxसेशन के अंदर चलाएं ताकि कटती कनेक्शन्स लंबे बैच जॉब्स को बाधित न करें।VRAM पर निगरानी रखें —
watch -n1 nvidia-smiदूसरे टर्मिनल में यह सुनिश्चित करने के लिए कि आप स्वैप पर नहीं पहुँच रहे हैं।
समस्याओं का निवारण
OutOfMemoryError
घटाएँ num_frames को 81 या चौड़ाई/ऊँचाई को 512×320 करें
मॉडल diffusers में नहीं मिला
अपग्रेड: pip install -U diffusers — LTXPipeline को diffusers ≥ 0.32 की आवश्यकता है
काला या स्थिर आउटपुट
सुनिश्चित करें कि आप एक negative_prompt; बढ़ाएँ guidance_scale को 8–9 तक
ImportError: imageio
pip install imageio[ffmpeg] — MP4 एक्सपोर्ट के लिए ffmpeg बैकएंड आवश्यक है
पहली इनफेरेंस धीमी
पहला रन CUDA कर्नेल कम्पाइल करता है और वेट डाउनलोड करता है; बाद के रन तेज़ होते हैं
रंग बैंडिंग आर्टिफैक्ट्स
उपयोग करें torch.bfloat16 (float16 नहीं); bfloat16 की डायनेमिक रेंज व्यापक है
कंटेनर मिड-जॉब में रिस्टार्ट हुआ
सेट करें HF_HOME परसिस्टेंट स्टोरेज पर; आंशिक HF डाउनलोड स्वतः फिर से सुरु हो जाते हैं
Last updated
Was this helpful?