Visión por computadora y modelos visión-idioma en GPU de CLORE.AI.
LLaVA
Chat y preguntas visuales
Florence-2
Visión multitarea
SAM2
Segmentación de video
GroundingDINO
Detección zero-shot
Comprensión de imágenes - LLaVA, Florence-2
Detección de objetos - GroundingDINO, YOLO
Segmentación - SAM2, Segment Anything
Generación de descripciones - Florence-2, LLaVA
LLaVA 7B
8GB
6GB
Modelos de Lenguaje
Visión por Computadora
Última actualización hace 1 mes
¿Te fue útil?