# Обзор

Компьютерное зрение и модели «зрение-язык» на GPU CLORE.AI.

## Доступные руководства

| Модель                                                                                  | Случай использования                 |
| --------------------------------------------------------------------------------------- | ------------------------------------ |
| [LLaVA](https://docs.clore.ai/guides/guides_v2-ru/modeli-zreniya/llava-vision-language) | Визуальный чат и вопросы-ответы      |
| [Florence-2](https://docs.clore.ai/guides/guides_v2-ru/modeli-zreniya/florence2)        | Многозадачное зрение                 |
| [SAM2](https://docs.clore.ai/guides/guides_v2-ru/modeli-zreniya/sam2-video)             | Сегментация видео                    |
| [GroundingDINO](https://docs.clore.ai/guides/guides_v2-ru/modeli-zreniya/groundingdino) | Обнаружение без обучения (zero-shot) |

## Сценарии использования

* **Понимание изображений** - LLaVA, Florence-2
* **Обнаружение объектов** - GroundingDINO, YOLO
* **Segmentation** - SAM2, Segment Anything
* **Создание подписей (captioning)** - Florence-2, LLaVA

## Требования к GPU

| Модель        | Минимальная VRAM |
| ------------- | ---------------- |
| LLaVA 7B      | 8GB              |
| Florence-2    | 8GB              |
| SAM2          | 8GB              |
| GroundingDINO | 6 ГБ             |

## Связанные руководства

* [Языковые модели](https://docs.clore.ai/guides/guides_v2-ru/yazykovye-modeli/language-models)
* [Компьютерное зрение](https://docs.clore.ai/guides/guides_v2-ru/kompyuternoe-zrenie/computer-vision)
