SAM2 Video

Seguimiento y segmentación de objetos en video con SAM2 de Meta en Clore.ai

Realice el seguimiento y segmentación de cualquier objeto en video con SAM2.1 de Meta: la versión mejorada de SAM2 con mayor precisión en video.

circle-check
circle-info

Todos los ejemplos en esta guía se pueden ejecutar en servidores GPU alquilados a través de CLORE.AI Marketplacearrow-up-right mercado.

Alquilar en CLORE.AI

  1. Filtrar por tipo de GPU, VRAM y precio

  2. Elegir Bajo demanda (tarifa fija) o Spot (precio de puja)

  3. Configura tu pedido:

    • Selecciona imagen Docker

    • Establece puertos (TCP para SSH, HTTP para interfaces web)

    • Agrega variables de entorno si es necesario

    • Introduce el comando de inicio

  4. Selecciona pago: CLORE, BTC, o USDT/USDC

  5. Crea el pedido y espera el despliegue

Accede a tu servidor

  • Encuentra los detalles de conexión en Mis Pedidos

  • Interfaces web: Usa la URL del puerto HTTP

  • SSH: ssh -p <port> root@<proxy-address>

¿Qué es SAM2?

SAM2 (Segment Anything Model 2) de Meta AI permite:

  • Segmentación de objetos en video en tiempo real

  • Hacer clic para rastrear cualquier objeto

  • Seguimiento consistente a través de oclusiones

  • Procesamiento de video eficiente en memoria

Novedades en SAM2.1

SAM2.1 aporta mejoras significativas sobre el SAM2 original:

  • Precisión mejorada en video — Mejor seguimiento a través de oclusiones y movimientos rápidos

  • Módulo de memoria mejorado — Seguimiento a largo plazo más consistente

  • Nuevos puntos de controlserie sam2.1_hiera_* con mejor rendimiento

  • Paquete pip oficial — Instalar con pip install sam-2 (no se requiere compilación manual)

  • Inferencia más rápida — Kernels CUDA optimizados

Recursos

Hardware recomendado

Componente
Mínimo
Recomendado
Óptimo

GPU

RTX 3060 12GB

RTX 4080 16GB

RTX 4090 24GB

VRAM

8GB

16GB

24GB

CPU

4 núcleos

8 núcleos

16 núcleos

RAM

16GB

32GB

64GB

Almacenamiento

30GB SSD

50GB NVMe

100GB NVMe

Internet

100 Mbps

500 Mbps

1 Gbps

Despliegue rápido en CLORE.AI

Imagen Docker:

Puertos:

Comando:

Accediendo a tu servicio

Después del despliegue, encuentra tu http_pub URL en Mis Pedidos:

  1. Ir a Mis Pedidos página

  2. Haz clic en tu pedido

  3. Encuentra la http_pub URL (por ejemplo, abc123.clorecloud.net)

Usa https://TU_HTTP_PUB_URL en lugar de localhost en los ejemplos abajo.

Instalación

Alternativa: Desde el código fuente (para desarrollo)

Lo que puedes crear

Edición de video

  • Eliminar objetos de videos

  • Reemplazar fondos sin interrupciones

  • Crear máscaras de video para composición

Análisis deportivo

  • Rastrear jugadores durante los partidos

  • Analizar patrones de movimiento

  • Generar resúmenes de jugadas

Imágenes médicas

  • Segmentar órganos en videos de TAC/RM

  • Rastrear movimiento celular en microscopía

  • Medir crecimiento a lo largo del tiempo

Vigilancia y seguridad

  • Rastrear objetos entre cámaras

  • Contar personas/vehículos

  • Detección de anomalías

Proyectos creativos

  • Rotoscopia para VFX

  • Instalaciones de video interactivas

  • Creación de contenido AR/VR

Uso básico

Segmentación de imágenes

Seguimiento de objetos en video

Seguimiento multiobjeto

Segmentación con indicación de caja

Interfaz Gradio

Exportar máscaras como video

Rendimiento

Tarea
Resolución
GPU
Velocidad

Segmentación de imágenes

1024x1024

RTX 3090

50ms

Segmentación de imágenes

1024x1024

RTX 4090

30 ms

Video (por fotograma)

720p

RTX 4090

45 ms

Video (por fotograma)

1080p

A100

35ms

Variantes del modelo (SAM2.1)

SAM2.1 introduce nuevos serie sam2.1_hiera_* puntos de control con precisión de seguimiento en video mejorada:

Modelo
Parámetros
VRAM
Velocidad
Calidad
Punto de control

sam2.1_hiera_tiny

38M

4GB

El más rápido

Bueno

sam2.1_hiera_tiny.pt

sam2.1_hiera_small

46M

5GB

Rápido

Mejor

sam2.1_hiera_small.pt

sam2.1_hiera_base_plus

80M

8GB

Medio

Genial

sam2.1_hiera_base_plus.pt

sam2.1_hiera_large

224M

12GB

Más lento

Mejor

sam2.1_hiera_large.pt

Nota: Los modelos SAM2.1 superan de manera consistente a sus homólogos SAM2 en benchmarks de video, especialmente para objetos que se mueven rápido y oclusiones prolongadas.

Problemas comunes y soluciones

Memoria insuficiente

Problema: CUDA fuera de memoria en videos largos

Soluciones:

Seguimiento perdido

Problema: El seguimiento de objetos falla a mitad del video

Soluciones:

  • Añadir puntos de corrección cuando el seguimiento se desplace

  • Usar indicaciones de caja para una mejor segmentación inicial

  • Elegir fotogramas iniciales más claros

Procesamiento lento

Problema: El procesamiento de video es demasiado lento

Soluciones:

  • Usar una variante de modelo más pequeña (tiny/small)

  • Reducir la resolución del video

  • Habilite media precisión (fp16)

  • Procesar en GPU A100

Mala calidad de máscaras

Problema: Los bordes de segmentación son irregulares

Soluciones:

  • Usar un modelo más grande (large en lugar de tiny)

  • Añadir más indicaciones por puntos

  • Combinar indicaciones por punto y por caja

Solución de problemas

Segmentación inexacta

  • Haga clic con más precisión en el objeto objetivo

  • Añadir múltiples puntos positivos/negativos

  • Usar indicación por caja para objetos grandes

Error de memoria de video

  • Procesar menos fotogramas a la vez

  • Reducir la resolución del video

  • Usar modo de transmisión para videos largos

Seguimiento perdido

  • Añadir más indicaciones cuando el objeto cambie

  • Usar la función de banco de memoria

  • Comprobar que el objeto no esté ocluido

Procesamiento lento

  • SAM2 requiere mucha computación

  • Usar A100 para videos largos

  • Considerar omitir fotogramas

Estimación de costos

Tarifas típicas del marketplace de CLORE.AI (a fecha de 2024):

GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Los precios varían según el proveedor y la demanda. Consulta CLORE.AI Marketplacearrow-up-right para las tarifas actuales.

Ahorra dinero:

  • Usa Spot market para cargas de trabajo flexibles (a menudo 30-50% más barato)

  • Paga con CLORE tokens

  • Compara precios entre diferentes proveedores

Próximos pasos

Última actualización

¿Te fue útil?