YOLOv9/v10 Erkennung

Modernste Echtzeit-Objekterkennung — trainieren und bereitstellen der neuesten YOLO-Modelle auf GPU

YOLO (You Only Look Once) bleibt der Goldstandard für Echtzeit-Objekterkennung. YOLOv9 führte Programmable Gradient Information (PGI) und Generalized Efficient Layer Aggregation Network (GELAN) ein, während YOLOv10 eine NMS-freie Erkennung mit dualen Label-Zuweisungen brachte. Beide liefern erstklassige Genauigkeits-/Geschwindigkeits-Kompromisse auf NVIDIA-GPUs.


YOLOv9 vs YOLOv10 vs YOLOv8 — Schneller Vergleich

Modell
mAP50-95
Geschwindigkeit (A100)
Parameter
NMS

YOLOv8x

53.9

14.2ms

68.2M

Erforderlich

YOLOv9e

55.6

16.8ms

57.3M

Erforderlich

YOLOv10x

54.4

10.7ms

29.5M

Frei

YOLOv10b

53.0

8.8ms

19.1M

Frei

YOLOv10s

46.8

4.2ms

7.2M

Frei

circle-check

Anwendungsfälle

  • Sicherheit & Überwachung — Echtzeit-Erkennung von Personen/Fahrzeugen/Objekten

  • Autonome Fahrzeuge — Erkennung von Fußgängern und Hindernissen

  • Fertigung QC — Fehlererkennung in Produktionslinien

  • Einzelhandelsanalyse — Kundenfluss- und Produkterkennung

  • Medizinische Bildgebung — Anomalieerkennung in Röntgenaufnahmen und Scans

  • Sportanalyse — Spieler- und Ballverfolgung

  • Landwirtschaft — Erkennung von Pflanzenkrankheiten und Schädlingen


Voraussetzungen

  • Clore.ai-Konto mit GPU-Vermietung

  • Trainingsdaten (für kundenspezifisches Modelltraining) oder Verwendung von COCO-vortrainierten Gewichten

  • Grundlegende Python- und Kommandozeilenkenntnisse


Schritt 1 — Mieten Sie eine GPU auf Clore.ai

  1. Gehe zu clore.aiarrow-up-rightMarktplatz

  2. Wählen Sie die GPU basierend auf Ihrer Aufgabe:

    • Nur Inferenz: RTX 3080/3090 oder RTX 4080 — ausgezeichnetes Preis-/Leistungsverhältnis

    • Training kleiner Modelle: RTX 4090 24GB

    • Training großer Modelle (YOLOv9e/YOLOv10x): A100 40/80GB

circle-info

Für Echtzeit-Inferenz (Videoströme) liefert die RTX 3090 oder RTX 4090 je nach Modellvariante 100–500 FPS. Sogar das kleinste YOLOv10n läuft mit TensorRT auf einer 4090 mit 1000+ FPS.


Schritt 2 — Bereitstellen des Ultralytics-Containers

Das offizielle Ultralytics Docker-Image unterstützt YOLOv8, YOLOv9 und YOLOv10 über eine einheitliche API:

Docker-Image:

Ports:

Umgebungsvariablen:

Festplatte: Mindestens 20 GB (vortrainierte Gewichte + Ihr Datensatz)


Schritt 3 — Verbinden und Überprüfen


Schritt 4 — Schnelle Inferenz mit vortrainierten Modellen

YOLOv10-Inferenz (NMS-frei)

YOLOv9-Inferenz

Echtzeit-Videostrom-Inferenz


Schritt 5 — Ein benutzerdefiniertes Modell trainieren

Bereite dein Dataset vor

YOLO verwendet eine bestimmte Verzeichnisstruktur und ein bestimmtes Label-Format:

Jede Label-Datei (gleicher Name wie das Bild, .txt Erweiterung) enthält:

Datensatz-Konfiguration erstellen

Import von Roboflow (empfohlen)

YOLOv10 trainieren

YOLOv9 trainieren

circle-info

Trainingstipps:

  • Batch-Größe: Beginnen Sie mit batch=16 für RTX 4090, batch=32 für A100 40GB

  • Bildgröße: imgsz=640 ist Standard; verwenden Sie 1280 für hochauflösende Aufgaben

  • Epochen: 100 Epochen sind typisch für Feinabstimmung, 300+ für Training von Grund auf

  • AMP (Mixed Precision): Immer aktivieren amp=True für 1,5–2x Beschleunigung


Schritt 6 — Export zu TensorRT für maximale Geschwindigkeit

In ONNX exportieren


Schritt 7 — Als REST-API bereitstellen


Schritt 8 — Validieren und Benchmarken Ihres Modells


Ergebnisse herunterladen


Fehlerbehebung

CUDA Out of Memory während des Trainings

Langsame Trainingsgeschwindigkeit

Niedriges mAP / Schlechte Erkennung


Leistungsreferenz (Clore.ai GPUs)

Modell
GPU
Batch
FPS (Inference)
mAP50-95

YOLOv10n

RTX 3090

1

1,200

38.5

YOLOv10s

RTX 3090

1

780

46.8

YOLOv10m

RTX 4090

1

950

51.3

YOLOv10x

RTX 4090

1

380

54.4

YOLOv9e

A100 40G

1

720

55.6

YOLOv10x TRT

RTX 4090

1

920

54.2


Weitere Ressourcen


YOLOv9 und YOLOv10 auf Clore.ai GPU-Vermietungen bieten einen erschwinglichen Weg, kundenspezifische Objekterkennungsmodelle zu trainieren und Echtzeit-Inferenzpipelines bereitzustellen — ohne den Overhead von AWS SageMaker oder Google Vertex AI.


Clore.ai GPU-Empfehlungen

Anwendungsfall
Empfohlene GPU
Geschätzte Kosten auf Clore.ai

Entwicklung/Tests

RTX 3090 (24GB)

~$0.12/gpu/hr

Produktions-Inferenz

RTX 4090 (24GB)

~$0.70/gpu/hr

Training mit großen Batches

A100 80GB

~$1.20/gpu/hr

💡 Alle Beispiele in diesem Leitfaden können bereitgestellt werden auf Clore.aiarrow-up-right GPU-Servern. Durchsuchen Sie verfügbare GPUs und mieten Sie stundenweise — keine Verpflichtungen, voller Root-Zugriff.

Zuletzt aktualisiert

War das hilfreich?