SAM2 वीडियो

Clore.ai पर Meta के SAM2 के साथ वीडियो में ऑब्जेक्ट ट्रैक और सेगमेंट करें

Meta के SAM2.1 के साथ वीडियो में किसी भी ऑब्जेक्ट को ट्रैक और सेगमेंट करें — SAM2 का बेहतर संस्करण जिसमें वीडियो सटीकता बढ़ाई गई है।

circle-check
circle-info

इस मार्गदर्शिका के सभी उदाहरणों को GPU सर्वरों पर चलाया जा सकता है जिन्हें के माध्यम से किराए पर लिया जाता है CLORE.AI मार्केटप्लेसarrow-up-right मार्केटप्लेस।

CLORE.AI पर किराये पर लेना

  1. GPU प्रकार, VRAM, और मूल्य के अनुसार फ़िल्टर करें

  2. चुनें ऑन-डिमांड (निश्चित दर) या स्पॉट (बिड प्राइस)

  3. अपना ऑर्डर कॉन्फ़िगर करें:

    • Docker इमेज चुनें

    • पोर्ट सेट करें (SSH के लिए TCP, वेब UI के लिए HTTP)

    • यदि आवश्यक हो तो एनवायरनमेंट वेरिएबल जोड़ें

    • स्टार्टअप कमांड दर्ज करें

  4. भुगतान चुनें: CLORE, BTC, या USDT/USDC

  5. ऑर्डर बनाएं और डिप्लॉयमेंट का इंतज़ार करें

अपने सर्वर तक पहुँचें

  • कनेक्शन विवरण में खोजें मेरे ऑर्डर

  • वेब इंटरफेस: HTTP पोर्ट URL का उपयोग करें

  • SSH: ssh -p <port> root@<proxy-address>

SAM2 क्या है?

Meta AI का SAM2 (Segment Anything Model 2) सक्षम बनाता है:

  • रीयल-टाइम वीडियो ऑब्जेक्ट सेगमेंटेशन

  • किसी भी ऑब्जेक्ट पर क्लिक करके ट्रैक करें

  • ओक्लुजन के दौरान सुसंगत ट्रैकिंग

  • मेमोरी-प्रभावी वीडियो प्रोसेसिंग

SAM2.1 में नया क्या है

SAM2.1 मूल SAM2 की तुलना में महत्वपूर्ण सुधार लाता है:

  • बेहतर वीडियो सटीकता — ओक्लूजन और तेज़ मूवमेंट के दौरान बेहतर ट्रैकिंग

  • सुधारित मेमोरी मॉड्यूल — अधिक सुसंगत लंबी दूरी की ट्रैकिंग

  • नए चेकपॉइंट्सsam2.1_hiera_* श्रृंखला बेहतर प्रदर्शन के साथ

  • आधिकारिक pip पैकेज — के साथ इंस्टॉल करें pip install sam-2 (कोई मैन्युअल बिल्ड आवश्यक नहीं)

  • तेज़ इन्फरेंस — अनुकूलित CUDA कर्नल

संसाधन

अनुशंसित हार्डवेयर

घटक
न्यूनतम
अनुशंसित
सर्वोत्तम

GPU

RTX 3060 12GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

8GB

16GB

24GB

CPU

4 कोर

8 कोर

16 कोर

RAM

16GB

32GB

64GB

स्टोरेज

30GB SSD

50GB NVMe

100GB NVMe

इंटरनेट

100 Mbps

500 Mbps

1 Gbps

CLORE.AI पर त्वरित डिप्लॉय

Docker इमेज:

पोर्ट:

कमांड:

अपनी सेवा तक पहुँचना

डिप्लॉयमेंट के बाद, अपना खोजें http_pub URL में मेरे ऑर्डर:

  1. जाएँ मेरे ऑर्डर पृष्ठ

  2. अपने ऑर्डर पर क्लिक करें

  3. खोजें http_pub URL (उदा., abc123.clorecloud.net)

उपयोग करें https://YOUR_HTTP_PUB_URL की बजाय localhost नीचे दिए उदाहरणों में।

इंस्टॉलेशन

विकल्प: स्रोत से (विकास के लिए)

आप क्या बना सकते हैं

वीडियो एडिटिंग

  • वीडियो से ऑब्जेक्ट हटाएँ

  • बैकग्राउंड को निर्बाध रूप से बदलें

  • कंपोजिटिंग के लिए वीडियो मास्क बनाएं

खेल विश्लेषण

  • खेलों में खिलाड़ियों को ट्रैक करें

  • मूवमेंट पैटर्न का विश्लेषण करें

  • हाइलाइट रील बनाएं

मेडिकल इमेजिंग

  • CT/MRI वीडियो में अंगों का सेगमेंटेशन करें

  • माइक्रोस्कोपी में कोशिका की गति को ट्रैक करें

  • समय के साथ वृद्धि को मापें

निगरानी और सुरक्षा

  • कैमरों के पार ऑब्जेक्ट्स को ट्रैक करें

  • लोगों/वाहनों की गिनती करें

  • अनोमली डिटेक्शन

रचनात्मक प्रोजेक्ट

  • VFX के लिए रोटोस्कोपिंग

  • इंटरैक्टिव वीडियो इंस्टॉलेशंस

  • AR/VR सामग्री निर्माण

मूल उपयोग

इमेज सेगमेंटेशन

वीडियो ऑब्जेक्ट ट्रैकिंग

मल्टी-ऑब्जेक्ट ट्रैकिंग

बॉक्स प्रॉम्प्ट सेगमेंटेशन

Gradio इंटरफ़ेस

मास्क को वीडियो के रूप में निर्यात करें

प्रदर्शन

कार्य
रिज़ॉल्यूशन
GPU
स्पीड

इमेज सेगमेंटेशन

1024x1024

RTX 3090

50ms

इमेज सेगमेंटेशन

1024x1024

RTX 4090

30ms

वीडियो (प्रति फ्रेम)

720p

RTX 4090

45ms

वीडियो (प्रति फ्रेम)

1080p

A100

35ms

मॉडल वेरिएंट्स (SAM2.1)

SAM2.1 पेश करता है नए sam2.1_hiera_* चेकपॉइंट्स बेहतर वीडियो ट्रैकिंग सटीकता के साथ:

मॉडल
पैरामीटर
VRAM
स्पीड
गुणवत्ता
चेकपॉइंट

sam2.1_hiera_tiny

38M

4GB

सबसे तेज

अच्छा

sam2.1_hiera_tiny.pt

sam2.1_hiera_small

46M

5GB

तेज़

बेहतर

sam2.1_hiera_small.pt

sam2.1_hiera_base_plus

80M

8GB

मध्यम

बहुत अच्छा

sam2.1_hiera_base_plus.pt

sam2.1_hiera_large

224M

12GB

धीमा

सर्वोत्तम

sam2.1_hiera_large.pt

नोट: वीडियो बेंचमार्क्स पर SAM2.1 मॉडल अपने SAM2 समकक्षों की तुलना में लगातार बेहतर प्रदर्शन करते हैं, विशेष रूप से तेज़ी से चलने वाले ऑब्जेक्ट्स और लंबी ओक्लूज़न्स के लिए।

सामान्य समस्याएँ और समाधान

आउट ऑफ़ मेमोरी

समस्या: लंबे वीडियो पर CUDA आउट ऑफ़ मेमोरी

समाधान:

ट्रैकिंग खो गई

समस्या: वीडियो के बीच में ऑब्जेक्ट ट्रैकिंग फेल हो रही है

समाधान:

  • जब ट्रैकिंग ड्रिफ्ट करे तो करेक्ट्शन पॉइंट्स जोड़ें

  • बेहतर प्रारंभिक सेगमेंटेशन के लिए बॉक्स प्रॉम्प्ट का उपयोग करें

  • क्लियर प्रारंभिक फ्रेम चुनें

धीमा प्रोसेसिंग

समस्या: वीडियो प्रोसेसिंग बहुत धीमी है

समाधान:

  • छोटा मॉडल वेरिएंट उपयोग करें (tiny/small)

  • वीडियो रिज़ॉल्यूशन घटाएँ

  • हेमि-प्रेसिज़न सक्षम करें (fp16)

  • A100 GPU पर प्रोसेस करें

मास्क गुणवत्ता खराब

समस्या: सेगमेंटेशन के किनारे खुरदरे हैं

समाधान:

  • छोटे के बजाय बड़े मॉडल का उपयोग करें (tiny के बजाय large)

  • अधिक प्वाइंट प्रॉम्प्ट जोड़ें

  • प्वाइंट और बॉक्स प्रॉम्प्ट को संयोजित करें

समस्याओं का निवारण

सेगमेंटेशन असटीक है

  • लक्ष्य ऑब्जेक्ट पर अधिक सटीकता से क्लिक करें

  • कई सकारात्मक/नकारात्मक पॉइंट जोड़ें

  • बड़े ऑब्जेक्ट्स के लिए बॉक्स प्रॉम्प्ट का उपयोग करें

वीडियो मेमोरी त्रुटि

  • एक बार में कम फ्रेम्स प्रोसेस करें

  • वीडियो रिज़ॉल्यूशन घटाएँ

  • लंबे वीडियो के लिए स्ट्रीमिंग मोड का उपयोग करें

ट्रैकिंग खो गया

  • जब ऑब्जेक्ट बदलता है तो अधिक प्रॉम्प्ट जोड़ें

  • मेरी बैंक फीचर का उपयोग करें

  • जांचें कि ऑब्जेक्ट ओक्लूडेड तो नहीं है

धीमा प्रोसेसिंग

  • SAM2 कम्प्यूटेशन-गहन है

  • लंबे वीडियो के लिए A100 का उपयोग करें

  • फ्रेम स्किपिंग पर विचार करें

लागत अनुमान

सामान्य CLORE.AI मार्केटप्लेस दरें (2024 के अनुसार):

GPU
घंटात्मक दर
दैनिक दर
4-घंटे सत्र

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

कीमतें प्रदाता और मांग के अनुसार बदलती हैं। जाँच करें CLORE.AI मार्केटप्लेसarrow-up-right वर्तमान दरों के लिए।

पैसे बचाएँ:

  • उपयोग करें स्पॉट लचीले वर्कलोड के लिए मार्केट (अक्सर 30-50% सस्ता)

  • भुगतान करें CLORE टोकन के साथ

  • विभिन्न प्रदाताओं के बीच कीमतों की तुलना करें

अगले कदम

  • GroundingDINO - स्वचालित रूप से सेगमेंट करने के लिए ऑब्जेक्ट्स का पता लगाना

  • Florence-2 - विजन-लैंग्वेज समझ

  • Depth Anything - डेप्थ अनुमान

Last updated

Was this helpful?