YOLOv9/v10 डिटेक्शन

उन्नत रीयल-टाइम ऑब्जेक्ट डिटेक्शन — GPU पर नवीनतम YOLO मॉडलों को ट्रेन और तैनात करें

YOLO (You Only Look Once) रीयल-टाइम ऑब्जेक्ट डिटेक्शन के लिए स्वर्ण मानक बना हुआ है। YOLOv9 ने Programmable Gradient Information (PGI) और Generalized Efficient Layer Aggregation Network (GELAN) पेश किए, जबकि YOLOv10 ने dual-label असाइनमेंट के साथ NMS-फ्री डिटेक्शन लाया। दोनों NVIDIA GPUs पर श्रेष्ठ सटीकता/गति संतुलन प्रदान करते हैं।


YOLOv9 vs YOLOv10 vs YOLOv8 — त्वरित तुलना

मॉडल
mAP50-95
गति (A100)
पैरामीटर्स
NMS

YOLOv8x

53.9

14.2ms

68.2M

आवश्यक

YOLOv9e

55.6

16.8ms

57.3M

आवश्यक

YOLOv10x

54.4

10.7ms

29.5M

मुक्त

YOLOv10b

53.0

8.8ms

19.1M

मुक्त

YOLOv10s

46.8

4.2ms

7.2M

मुक्त

circle-check

उपयोग के मामले

  • सुरक्षा और निगरानी — रीयल-टाइम व्यक्ति/वाहन/वस्तु पहचान

  • स्वायत्त वाहन — पैदल चलने वालों और बाधाओं का पता लगाना

  • निर्माण गुणवत्ता नियंत्रण — उत्पादन लाइनों पर दोष पहचान

  • रिटेल एनालिटिक्स — ग्राहक प्रवाह और उत्पाद पहचान

  • मेडिकल इमेजिंग — एक्स-रे और स्कैन में असामान्यता पहचान

  • स्पोर्ट्स एनालिटिक्स — खिलाड़ी और गेंद ट्रैकिंग

  • कृषि — फसल रोग और कीट पहचान


पूर्व-आवश्यकताएँ

  • GPU किराये के साथ Clore.ai खाता

  • कस्टम मॉडल प्रशिक्षण के लिए प्रशिक्षण डेटा या COCO प्रीट्रेंड वेट्स का उपयोग

  • बुनियादी Python और कमांड लाइन ज्ञान


चरण 1 — Clore.ai पर एक GPU किराए पर लें

  1. जाएँ clore.aiarrow-up-rightमार्केटप्लेस

  2. अपने कार्य के आधार पर GPU चुनें:

    • सिर्फ इनफरेंस के लिए: RTX 3080/3090 या RTX 4080 — उत्कृष्ट मूल्य/प्रदर्शन

    • छोटे मॉडलों का प्रशिक्षण: RTX 4090 24GB

    • बड़े मॉडलों का प्रशिक्षण (YOLOv9e/YOLOv10x): A100 40/80GB

circle-info

रीयल-टाइम इनफरेंस के लिए (वीडियो स्ट्रीम्स), RTX 3090 या RTX 4090 मॉडल वेरिएंट पर निर्भर होकर 100–500 FPS प्रदान करता है। यहां तक कि सबसे छोटा YOLOv10n 4090 पर TensorRT के साथ 1000+ FPS पर चलता है।


चरण 2 — Ultralytics कंटेनर तैनात करें

आधिकारिक Ultralytics Docker इमेज YOLOv8, YOLOv9, और YOLOv10 को एकीकृत API के माध्यम से समर्थित करता है:

Docker इमेज:

पोर्ट्स:

पर्यावरण चर:

डिस्क: 20GB न्यूनतम (प्रिट्रेंड वेट्स + आपका डेटासेट)


चरण 3 — कनेक्ट और सत्यापित करें


चरण 4 — प्रीट्रेंड मॉडलों के साथ त्वरित इनफरेंस

YOLOv10 इनफरेंस (NMS-फ्री)

YOLOv9 इनफरेंस

रीयल-टाइम वीडियो स्ट्रीम इनफरेंस


चरण 5 — एक कस्टम मॉडल ट्रेन करें

अपना डेटासेट तैयार करें

YOLO एक विशिष्ट निर्देशिका संरचना और लेबल प्रारूप का उपयोग करता है:

प्रत्येक लेबल फ़ाइल (इमेज के समान नाम, .txt एक्सटेंशन) में शामिल है:

डेटासेट कॉन्फ़िग बनाएं

Roboflow से इम्पोर्ट करें (सिफारिश की गई)

YOLOv10 ट्रेन करें

YOLOv9 ट्रेन करें

circle-info

प्रशिक्षण सुझाव:

  • बैच साइज: शुरू करें batch=16 RTX 4090 के लिए, batch=32 A100 40GB के लिए

  • इमेज साइज: imgsz=640 मानक है; उच्च-रिज़ॉल्यूशन कार्यों के लिए 1280 का उपयोग करें

  • एपोच: फाइन-ट्यूनिंग के लिए 100 एपोच सामान्य है, स्क्रैच से ट्रेनिंग के लिए 300+

  • AMP (मिक्स्ड प्रिसिशन): हमेशां सक्षम करें amp=True 1.5–2x स्पीडअप के लिए


चरण 6 — अधिकतम गति के लिए TensorRT में एक्सपोर्ट करें

ONNX में एक्सपोर्ट करें


चरण 7 — REST API के रूप में सर्व करें


चरण 8 — अपने मॉडल को वैधता दें और बेंचमार्क करें


परिणाम डाउनलोड करें


समस्या निवारण

प्रशिक्षण के दौरान CUDA Out of Memory

धीमी प्रशिक्षण गति

कम mAP / खराब डिटेक्शन


प्रदर्शन संदर्भ (Clore.ai GPUs)

मॉडल
GPU
बैच
FPS (इनफरेंस)
mAP50-95

YOLOv10n

RTX 3090

1

1,200

38.5

YOLOv10s

RTX 3090

1

780

46.8

YOLOv10m

RTX 4090

1

950

51.3

YOLOv10x

RTX 4090

1

380

54.4

YOLOv9e

A100 40G

1

720

55.6

YOLOv10x TRT

RTX 4090

1

920

54.2


अतिरिक्त संसाधन


Clore.ai GPU किराये पर YOLOv9 और YOLOv10 कस्टम ऑब्जेक्ट डिटेक्शन मॉडल ट्रेन करने और रीयल-टाइम इनफरेंस पाइपलाइनों को तैनात करने के लिए किफायती मार्ग प्रदान करते हैं — बिना AWS SageMaker या Google Vertex AI के ओवरहेड के।


Clore.ai GPU सिफारिशें

उपयोग केस
सिफारिश की गई GPU
Clore.ai पर अनुमानित लागत

डेवलपमेंट/टेस्टिंग

RTX 3090 (24GB)

~$0.12/gpu/hr

उत्पादन इन्फरेंस

RTX 4090 (24GB)

~$0.70/gpu/hr

बड़े-बैच प्रशिक्षण

A100 80GB

~$1.20/gpu/hr

💡 इस गाइड के सभी उदाहरण तैनात किए जा सकते हैं Clore.aiarrow-up-right GPU सर्वरों पर। उपलब्ध GPUs ब्राउज़ करें और घंटे के हिसाब से किराए पर लें — कोई प्रतिबद्धता नहीं, पूर्ण रूट एक्सेस।

Last updated

Was this helpful?