GroundingDINO

GroundingDINO के साथ टेक्स्ट विवरणों का उपयोग करके किसी भी ऑब्जेक्ट का पता लगाएँ

GroundingDINO के साथ पाठ विवरणों का उपयोग करके किसी भी वस्तु का पता लगाएँ।

circle-check
circle-info

इस मार्गदर्शिका के सभी उदाहरणों को GPU सर्वरों पर चलाया जा सकता है जिन्हें के माध्यम से किराए पर लिया जाता है CLORE.AI मार्केटप्लेसarrow-up-right मार्केटप्लेस।

CLORE.AI पर किराये पर लेना

  1. GPU प्रकार, VRAM, और मूल्य के अनुसार फ़िल्टर करें

  2. चुनें ऑन-डिमांड (निश्चित दर) या स्पॉट (बिड प्राइस)

  3. अपना ऑर्डर कॉन्फ़िगर करें:

    • Docker इमेज चुनें

    • पोर्ट सेट करें (SSH के लिए TCP, वेब UI के लिए HTTP)

    • यदि आवश्यक हो तो एनवायरनमेंट वेरिएबल जोड़ें

    • स्टार्टअप कमांड दर्ज करें

  4. भुगतान चुनें: CLORE, BTC, या USDT/USDC

  5. ऑर्डर बनाएं और डिप्लॉयमेंट का इंतज़ार करें

अपने सर्वर तक पहुँचें

  • कनेक्शन विवरण में खोजें मेरे ऑर्डर

  • वेब इंटरफेस: HTTP पोर्ट URL का उपयोग करें

  • SSH: ssh -p <port> root@<proxy-address>

GroundingDINO क्या है?

IDEA-Research द्वारा GroundingDINO सक्षम करता है:

  • पाठ प्रॉम्प्ट के साथ शून्य-शॉट वस्तु पहचान

  • प्रशिक्षण के बिना किसी भी वस्तु का पता लगाएँ

  • उच्च-सटीकता बाउंडिंग बॉक्स लोकलाइज़ेशन

  • स्वचालित सेगमेंटेशन के लिए SAM के साथ संयोजन

संसाधन

अनुशंसित हार्डवेयर

घटक
न्यूनतम
अनुशंसित
सर्वोत्तम

GPU

RTX 3060 12GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

6GB

12GB

16GB

CPU

4 कोर

8 कोर

16 कोर

RAM

16GB

32GB

64GB

स्टोरेज

20GB SSD

50GB NVMe

100GB NVMe

इंटरनेट

100 Mbps

500 Mbps

1 Gbps

CLORE.AI पर त्वरित डिप्लॉय

Docker इमेज:

पोर्ट:

कमांड:

अपनी सेवा तक पहुँचना

डिप्लॉयमेंट के बाद, अपना खोजें http_pub URL में मेरे ऑर्डर:

  1. जाएँ मेरे ऑर्डर पृष्ठ

  2. अपने ऑर्डर पर क्लिक करें

  3. खोजें http_pub URL (उदा., abc123.clorecloud.net)

उपयोग करें https://YOUR_HTTP_PUB_URL की बजाय localhost नीचे दिए उदाहरणों में।

इंस्टॉलेशन

आप क्या बना सकते हैं

स्वचालित लेबलिंग

  • एमएल प्रशिक्षण के लिए डेटासेट स्वचालित रूप से एनोटेट करें

  • विवरणों से बाउंडिंग बॉक्स उत्पन्न करें

  • डेटा लेबलिंग पाइपलाइनों को तेज करें

विज़ुअल सर्च

  • इमेज डेटाबेस में विशिष्ट वस्तुओं को खोजें

  • कंटेंट मॉडरेशन सिस्टम

  • रिटेल में उत्पाद की पहचान

रोबोटिक्स और ऑटोमेशन

  • रोबोट आर्म के लिए वस्तु स्थानिकरण

  • इन्वेंटरी प्रबंधन प्रणाली

  • गुणवत्ता नियंत्रण निरीक्षण

रचनात्मक अनुप्रयोग

  • फोटोज़ से विषयों को ऑटो-कॉर्प करें

  • SAM के साथ वस्तु मास्क जेनरेट करें

  • कंटेंट-अवेयर इमेज संपादन

विश्लेषण

  • छवियों में वस्तुओं की गणना करें

  • फोटो से इन्वेंटरी ट्रैक करें

  • वन्यजीव निगरानी

मूल उपयोग

GroundingDINO + SAM (Grounded-SAM)

डिटेक्शन को सेगमेंटेशन के साथ जोड़ें:

बैच प्रोसेसिंग

कस्टम डिटेक्शन पाइपलाइन

Gradio इंटरफ़ेस

प्रदर्शन

कार्य
रिज़ॉल्यूशन
GPU
स्पीड

एकल छवि

800x600

RTX 3090

120ms

एकल छवि

800x600

RTX 4090

80ms

एकल छवि

1920x1080

RTX 4090

150ms

बैच (10 छवियाँ)

800x600

RTX 4090

600ms

सामान्य समस्याएँ और समाधान

कम डिटेक्शन सटीकता

समस्या: वस्तुएँ पता नहीं लग रही हैं

समाधान:

  • कम करें box_threshold 0.2-0.3 पर

  • कम करें text_threshold 0.15-0.2 पर

  • और अधिक विशिष्ट वस्तु विवरणों का उपयोग करें

  • वस्तुओं को अल्पविराम के बजाय " . " से अलग करें

आउट ऑफ़ मेमोरी

समस्या: बड़ी छवियों पर CUDA OOM

समाधान:

धिमा इनफ़रेंस

समस्या: डिटेक्शन बहुत समय ले रहा है

समाधान:

  • छोटे इनपुट छवियों का उपयोग करें

  • कई छवियों को बैच में प्रोसेस करें

  • FP16 इन्फरेंस का उपयोग करें

  • तेज़ GPU किराये पर लें (RTX 4090, A100)

गलत सकारात्मक (False Positives)

समस्या: गलत वस्तुओं का पता लगना

समाधान:

  • बढ़ाएँ box_threshold 0.4-0.5 पर

  • प्रॉम्प्ट में अधिक विशिष्ट रहें

  • नकारात्मक प्रॉम्प्ट का उपयोग करें (डिटेक्शन के बाद परिणाम फ़िल्टर करें)

समस्याओं का निवारण

ऑब्जेक्ट्स डिटेक्ट नहीं हो रहे हैं

  • अधिक विशिष्ट पाठ विवरणों का उपयोग करें

  • विभिन्न वाक्य-विन्यास आज़माएँ

  • कॉन्फिडेंस थ्रेशोल्ड कम करें

बाउंडिंग बॉक्स गलत हैं

  • पाठ प्रॉम्प्ट में अधिक विशिष्ट रहें

  • कई वस्तुओं को अलग करने के लिए "." का उपयोग करें

  • छवि गुणवत्ता जांचें

triangle-exclamation
  • छवि रिज़ॉल्यूशन कम करें

  • छवियों को एक-एक करके प्रोसेस करें

  • छोटे मॉडल वेरिएंट का उपयोग करें

धीमी निष्पादन गति

  • गति के लिए TensorRT का उपयोग करें

  • समान आकार की छवियों को बैच में प्रोसेस करें

  • FP16 इन्फरेंस सक्षम करें

लागत अनुमान

सामान्य CLORE.AI मार्केटप्लेस दरें (2024 के अनुसार):

GPU
घंटात्मक दर
दैनिक दर
4-घंटे सत्र

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

कीमतें प्रदाता और मांग के अनुसार बदलती हैं। जाँच करें CLORE.AI मार्केटप्लेसarrow-up-right वर्तमान दरों के लिए।

पैसे बचाएँ:

  • उपयोग करें स्पॉट लचीले वर्कलोड के लिए मार्केट (अक्सर 30-50% सस्ता)

  • भुगतान करें CLORE टोकन के साथ

  • विभिन्न प्रदाताओं के बीच कीमतों की तुलना करें

अगले कदम

  • SAM2 - डिटेक्ट किए गए ऑब्जेक्ट्स का सेगमेंट

  • Florence-2 - और अधिक विज़न कार्य

  • YOLO - ज्ञात वर्गों के लिए तेज़ डिटेक्शन

Last updated

Was this helpful?