SAM2 Video

Отслеживайте и сегментируйте объекты в видео с SAM2 от Meta на Clore.ai

Отслеживайте и сегментируйте любые объекты в видео с помощью SAM2.1 от Meta — улучшенной версии SAM2 с повышенной точностью для видео.

circle-check
circle-info

Все примеры в этом руководстве можно запустить на GPU-серверах, арендуемых через CLORE.AI Marketplacearrow-up-right маркетплейс.

Аренда на CLORE.AI

  1. Отфильтруйте по типу GPU, объему VRAM и цене

  2. Выберите On-Demand (фиксированная ставка) или Spot (цена по ставке)

  3. Настройте ваш заказ:

    • Выберите Docker-образ

    • Установите порты (TCP для SSH, HTTP для веб-интерфейсов)

    • Добавьте переменные окружения при необходимости

    • Введите команду запуска

  4. Выберите способ оплаты: CLORE, BTC, или USDT/USDC

  5. Создайте заказ и дождитесь развертывания

Доступ к вашему серверу

  • Найдите данные для подключения в Моих заказах

  • Веб-интерфейсы: используйте URL HTTP-порта

  • SSH: ssh -p <port> root@<proxy-address>

Что такое SAM2?

SAM2 (Segment Anything Model 2) от Meta AI позволяет:

  • Сегментация объектов в видео в реальном времени

  • Клик — чтобы отслеживать любой объект

  • Последовательное отслеживание при окклюзиях

  • Памятееффективная обработка видео

Что нового в SAM2.1

SAM2.1 приносит значительные улучшения по сравнению с оригинальным SAM2:

  • Улучшенная точность для видео — Лучше отслеживает при окклюзиях и быстром движении

  • Усовершенствованный модуль памяти — Более стабильное долгосрочное отслеживание

  • Новые контрольные точкисерия sam2.1_hiera_* с лучшей производительностью

  • Официальный пакет pip — Установите с помощью pip install sam-2 (ручная сборка не требуется)

  • Более быстрое инференсирование — Оптимизированные CUDA-ядра

Ресурсы

Рекомендованное оборудование

Компонент
Минимум
Рекомендуется
Оптимально

GPU

RTX 3060 12GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

8GB

16GB

24 ГБ

CPU

4 ядра

8 ядер

16 ядер

ОЗУ

16GB

32GB

64GB

Хранилище

30GB SSD

50GB NVMe

100GB NVMe

Интернет

100 Мбит/с

500 Мбит/с

1 Гбит/с

Быстрое развертывание на CLORE.AI

Docker-образ:

Порты:

Команда:

Доступ к вашему сервису

После развертывания найдите ваш http_pub URL в Моих заказах:

  1. Перейдите на Моих заказах страницу

  2. Нажмите на ваш заказ

  3. Найдите http_pub URL (например, abc123.clorecloud.net)

Используйте https://YOUR_HTTP_PUB_URL вместо localhost в примерах ниже.

Установка

Альтернатива: из исходников (для разработки)

Что вы можете создать

Редактирование видео

  • Удалять объекты из видео

  • Бесшовно заменять фоны

  • Создавать маски для композитинга видео

Анализ спорта

  • Отслеживать игроков в матчах

  • Анализировать шаблоны движения

  • Генерировать ролики с моментами

Медицинская визуализация

  • Сегментировать органы на CT/MRI-видео

  • Отслеживать движение клеток в микроскопии

  • Измерять рост со временем

Наблюдение и безопасность

  • Отслеживать объекты между камерами

  • Считать людей/транспорт

  • Обнаружение аномалий

Творческие проекты

  • Ротоскопинг для VFX

  • Интерактивные видеоинсталляции

  • Создание контента для AR/VR

Базовое использование

Сегментация изображений

Отслеживание объектов в видео

Отслеживание нескольких объектов

Сегментация по рамке (Box Prompt)

Интерфейс Gradio

Экспорт масок как видео

Производительность

Задача
Разрешение
GPU
Скорость

Сегментация изображений

1024x1024

RTX 3090

50 мс

Сегментация изображений

1024x1024

RTX 4090

30мс

Видео (на кадр)

720p

RTX 4090

45мс

Видео (на кадр)

1080p

A100

35мс

Варианты моделей (SAM2.1)

SAM2.1 представляет новые серия sam2.1_hiera_* контрольные точки с улучшенной точностью отслеживания в видео:

Модель
Параметры
VRAM
Скорость
Качество
Контрольная точка

sam2.1_hiera_tiny

38M

4 ГБ

Самая быстрая

Хорошо

sam2.1_hiera_tiny.pt

sam2.1_hiera_small

46M

5 ГБ

Быстро

Лучше

sam2.1_hiera_small.pt

sam2.1_hiera_base_plus

80M

8GB

Средне

Отлично

sam2.1_hiera_base_plus.pt

sam2.1_hiera_large

224M

12GB

Медленнее

Лучшее

sam2.1_hiera_large.pt

Примечание: Модели SAM2.1 стабильно превосходят свои аналоги SAM2 по видео-бенчмаркам, особенно для быстро движущихся объектов и длительных окклюзий.

Распространённые проблемы и решения

Недостаточно памяти

Проблема: Ошибка CUDA: недостаточно памяти на длинных видео

Решения:

Потеря отслеживания

Проблема: Отслеживание объекта прерывается в середине видео

Решения:

  • Добавьте корректирующие точки, когда отслеживание уходит в дрейф

  • Используйте подсказки в виде рамки для лучшей начальной сегментации

  • Выбирайте более четкие начальные кадры

Медленная обработка

Проблема: Обработка видео слишком медленная

Решения:

  • Используйте меньший вариант модели (tiny/small)

  • Уменьшите разрешение видео

  • Включите половинную точность (fp16)

  • Обрабатывайте на GPU A100

Плохое качество масок

Проблема: Границы сегментации грубые

Решения:

  • Используйте большую модель (large вместо tiny)

  • Добавьте больше точечных подсказок

  • Комбинируйте точечные и рамочные подсказки

Устранение неполадок

Сегментация неточная

  • Кликайте точнее по целевому объекту

  • Добавьте несколько положительных/отрицательных точек

  • Используйте рамочную подсказку для больших объектов

Ошибка памяти при обработке видео

  • Обрабатывайте меньше кадров за раз

  • Уменьшите разрешение видео

  • Используйте потоковый режим для длинных видео

Отслеживание потеряно

  • Добавляйте больше подсказок, когда объект меняется

  • Используйте функцию банка памяти

  • Проверьте, что объект не закрыт

Медленная обработка

  • SAM2 требует больших вычислений

  • Используйте A100 для длинных видео

  • Рассмотрите пропуск кадров

Оценка стоимости

Типичные ставки на маркетплейсе CLORE.AI (по состоянию на 2024):

GPU
Почасовая ставка
Дневная ставка
Сессия 4 часа

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Цены варьируются в зависимости от провайдера и спроса. Проверьте CLORE.AI Marketplacearrow-up-right для текущих тарифов.

Экономьте деньги:

  • Используйте Spot рынок для гибких рабочих нагрузок (часто на 30–50% дешевле)

  • Платите с помощью CLORE токенов

  • Сравнивайте цены у разных провайдеров

Дальнейшие шаги

  • GroundingDINO - Автообнаружение объектов для сегментации

  • Florence-2 - Понимание на стыке зрения и языка

  • Depth Anything - Оценка глубины

Последнее обновление

Это было полезно?