Обзор

Компьютерное зрение и модели «зрение-язык» на GPU CLORE.AI.

Доступные руководства

Модель
Случай использования

Визуальный чат и вопросы-ответы

Многозадачное зрение

Сегментация видео

Обнаружение без обучения (zero-shot)

Сценарии использования

  • Понимание изображений - LLaVA, Florence-2

  • Обнаружение объектов - GroundingDINO, YOLO

  • Segmentation - SAM2, Segment Anything

  • Создание подписей (captioning) - Florence-2, LLaVA

Требования к GPU

Модель
Минимальная VRAM

LLaVA 7B

8GB

Florence-2

8GB

SAM2

8GB

GroundingDINO

6 ГБ

Связанные руководства

Последнее обновление

Это было полезно?