लाइवपोर्ट्रेट

Clore.ai पर एकल छवियों से वास्तविक-सदृश एनिमेटेड पोर्ट्रेट बनाएं

एकल छवियों से वास्तविक दिखने वाले एनिमेटेड पोर्ट्रेट बनाएं।

circle-check
circle-info

इस मार्गदर्शिका के सभी उदाहरणों को GPU सर्वरों पर चलाया जा सकता है जिन्हें के माध्यम से किराए पर लिया जाता है CLORE.AI मार्केटप्लेसarrow-up-right मार्केटप्लेस।

CLORE.AI पर किराए पर लेना

  1. GPU प्रकार, VRAM और कीमत द्वारा फ़िल्टर करें

  2. चुनें ऑन-डिमांड (निर्धारित दर) या स्पॉट (बिड कीमत)

  3. अपना ऑर्डर कॉन्फ़िगर करें:

    • Docker इमेज चुनें

    • पोर्ट सेट करें (SSH के लिए TCP, वेब UI के लिए HTTP)

    • ज़रूरत होने पर पर्यावरण चर जोड़ें

    • स्टार्टअप कमांड दर्ज करें

  4. भुगतान चुनें: CLORE, BTC, या USDT/USDC

  5. ऑर्डर बनाएँ और डिप्लॉयमेंट की प्रतीक्षा करें

अपने सर्वर तक पहुँचें

  • कनेक्शन विवरण खोजें मेरे ऑर्डर्स

  • वेब इंटरफेस: HTTP पोर्ट URL का उपयोग करें

  • SSH: ssh -p <port> root@<proxy-address>

लाइवपोर्ट्रेट क्या है?

Kuaishou का LivePortrait सक्षम करता है:

  • किसी भी पोर्ट्रेट को ड्राइविंग वीडियो से एनिमेट करें

  • सिंगल फोटो से वीडियो एनिमेशन

  • अभिव्यक्ति और पोस ट्रांसफर

  • रीयल-टाइम सक्षम इन्फरेंस

संसाधन

अनुशंसित हार्डवेयर

घटक
न्यूनतम
अनुशंसित
सर्वोत्तम

GPU

RTX 3070 8GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

8GB

16GB

24GB

CPU

4 कोर

8 कोर

16 कोर

RAM

16GB

32GB

64GB

स्टोरेज

30GB SSD

50GB NVMe

100GB NVMe

इंटरनेट

100 Mbps

500 Mbps

1 Gbps

CLORE.AI पर त्वरित डिप्लॉय

Docker इमेज:

पोर्ट्स:

कमांड:

अपनी सेवा तक पहुँच

डिप्लॉयमेंट के बाद, अपना खोजें http_pub URL में मेरे ऑर्डर्स:

  1. पर जाएँ मेरे ऑर्डर्स पृष्ठ

  2. अपने ऑर्डर पर क्लिक करें

  3. खोजें http_pub URL (उदा., abc123.clorecloud.net)

उपयोग करें https://YOUR_HTTP_PUB_URL के बजाय localhost नीचे दिए गए उदाहरणों में।

स्थापना

आप क्या बना सकते हैं

वर्चुअल अवतार

  • AI इन्फ्लुएंसर्स और वर्चुअल एंकर्स

  • कस्टमर सर्विस अवतार

  • शैक्षिक प्रस्तुतकर्ता

सामग्री निर्माण

  • सोशल मीडिया सामग्री

  • मार्केटिंग सामग्री

  • म्यूजिक वीडियो कॉन्सेप्ट

मनोरंजन

  • ऐतिहासिक फोटो को एनिमेट करें

  • करेक्टर एनिमेशन

  • इंटरैक्टिव अनुभव

पेशेवर उपयोग

  • वीडियो कॉन्फ्रेंसिंग अवतार

  • प्रेजेंटेशन असिस्टेंट

  • ट्रेनिंग सिमुलेशन

मूल उपयोग

कमांड लाइन

Python API

अभिव्यक्ति नियंत्रण के साथ पोर्ट्रेट

बैच प्रोसेसिंग

Gradio इंटरफ़ेस

रीयल-टाइम वेबकैम एनिमेशन

TTS के साथ एकीकरण

टेक्स्ट-टू-स्पीच के साथ बोलने वाले अवतार बनाएं:

प्रदर्शन

रिज़ॉल्यूशन
GPU
FPS
लेटेंसी

256x256

RTX 3070

30

33ms

256x256

RTX 4090

60+

16ms

512x512

RTX 4090

30

33ms

512x512

A100

45

22ms

सामान्य समस्याएँ और समाधान

चेहरा नहीं पाया गया

समस्या: "स्रोत छवि में कोई चेहरा नहीं पाया गया"

समाधान:

  • सुनिश्चित करें कि चेहरा स्पष्ट रूप से दिखाई दे और सामने की ओर हो

  • स्रोत छवि में अच्छी लाइटिंग का उपयोग करें

  • चेहरे पर फोकस करने के लिए छवि को क्रॉप करें

  • न्यूनतम फेस साइज: 128x128 पिक्सेल

गति मेल नहीं खाती

समस्या: एनिमेशन ड्राइविंग वीडियो का पालन नहीं करता

समाधान:

  • स्पष्ट चेहरे की चाल वाले ड्राइविंग वीडियो का उपयोग करें

  • सुनिश्चित करें कि ड्राइविंग वीडियो में चेहरे की ओरिएंटेशन समान हो

  • विभिन्न ड्राइविंग वीडियो आज़माएँ

गुणवत्ता समस्याएँ

समस्या: आउटपुट धुंधला या विकृत दिखता है

समाधान:

रीयल-टाइम लैग

समस्या: वेबकैम एनिमेशन लैगी है

समाधान:

  • छोटी आउटपुट रेज़ोल्यूशन (256x256) का उपयोग करें

  • TensorRT अनुकूलन सक्षम करें

  • रीयल-टाइम के लिए RTX 4090 या बेहतर का उपयोग करें

ऑडियो सिंक समस्याएँ

समस्या: होंठ की हलचल ऑडियो से मेल नहीं खाती

समाधान:

  • ऑडियो-से-ड्राइविंग वीडियो जेनरेशन का उपयोग करें

  • पोस्ट-प्रोसेसिंग में वीडियो टाइमिंग समायोजित करें

  • बेहतर लिप-सिंक के लिए Wav2Lip का उपयोग करें

समस्या निवारण

चेहरा नहीं मिला

  • सुनिश्चित करें कि स्रोत में चेहरा स्पष्ट रूप से दिखाई दे

  • सामने की ओर वाली फोटो का उपयोग करें

  • इमेज रेज़ोल्यूशन की जाँच करें (512+ अनुशंसित)

एनिमेशन अप्राकृतिक दिखता है

  • स्रोत और ड्राइविंग वीडियो में चेहरे के कोण समान होने चाहिए

  • ड्राइविंग वीडियो में अत्यधिक भाव-भंगिमाओं से बचें

  • छोटे ड्राइविंग क्लिप का उपयोग करें

आउटपुट वीडियो भ्रष्ट है

  • ffmpeg इंस्टॉल करें: apt install ffmpeg

  • आउटपुट फ़ॉर्मेट संगतता की जाँच करें

  • पर्याप्त डिस्क स्थान सुनिश्चित करें

CUDA त्रुटियाँ

  • अनुकूल PyTorch संस्करण इंस्टॉल करें

  • जाँच करें कि CUDA संस्करण आवश्यकताओं से मेल खाता है

लागत अनुमान

सामान्य CLORE.AI मार्केटप्लेस दरें (2024 के अनुसार):

GPU
घंटा दर
दैनिक दर
4-घंटे सत्र

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

कीमतें प्रदाता और माँग के अनुसार बदलती हैं। वर्तमान दरों के लिए जाँच करें CLORE.AI मार्केटप्लेसarrow-up-right

पैसे बचाएँ:

  • उपयोग करें स्पॉट लचीले वर्कलोड के लिए मार्केट (अकसर 30-50% सस्ता)

  • के साथ भुगतान करें CLORE टोकन

  • विभिन्न प्रदाताओं के बीच कीमतों की तुलना करें

अगले कदम

  • SadTalker - वैकल्पिक टॉकिंग हेड

  • Wav2Lip - बेहतर लिप-सिंक

  • XTTS - वॉइस जेनरेशन

Last updated

Was this helpful?