Aperçu

Vision par ordinateur et modèles vision-langage sur les GPU CLORE.AI.

Guides disponibles

Modèle
Cas d'utilisation

Chat visuel et QA

Vision multitâche

Segmentation vidéo

Détection sans apprentissage préalable

Cas d'utilisation

  • Compréhension d'image - LLaVA, Florence-2

  • Détection d'objets - GroundingDINO, YOLO

  • Segmentation - SAM2, Segment Anything

  • Génération de légendes - Florence-2, LLaVA

Exigences GPU

Modèle
VRAM minimale

LLaVA 7B

8 Go

Florence-2

8 Go

SAM2

8 Go

GroundingDINO

6 Go

Guides connexes

Mis à jour

Ce contenu vous a-t-il été utile ?