SAM2 视频

在 Clore.ai 上使用 Meta 的 SAM2 跟踪与分割视频中的对象

使用 Meta 的 SAM2.1 在视频中跟踪和分割任何对象 —— 这是在视频准确性上改进的 SAM2 的增强版本。

circle-check
circle-info

本指南中的所有示例都可以在通过以下方式租用的 GPU 服务器上运行: CLORE.AI 市场arrow-up-right 市场。

在 CLORE.AI 上租用

  1. 按 GPU 类型、显存和价格筛选

  2. 选择 按需 (固定费率)或 竞价 (出价价格)

  3. 配置您的订单:

    • 选择 Docker 镜像

    • 设置端口(用于 SSH 的 TCP,Web 界面的 HTTP)

    • 如有需要,添加环境变量

    • 输入启动命令

  4. 选择支付方式: CLORE, BTC,或 USDT/USDC

  5. 创建订单并等待部署

访问您的服务器

  • 在以下位置查找连接详情: 我的订单

  • Web 界面:使用 HTTP 端口的 URL

  • SSH: ssh -p <port> root@<proxy-address>

什么是 SAM2?

Meta AI 的 SAM2(Segment Anything Model 2)可以实现:

  • 实时视频对象分割

  • 点击即可跟踪任意对象

  • 通过遮挡保持一致的跟踪

  • 内存高效的视频处理

SAM2.1 的新特性

SAM2.1 相比原始 SAM2 带来了显著改进:

  • 提高的视频准确性 — 在遮挡和快速运动情况下更好的跟踪

  • 增强的记忆模块 — 更一致的长程跟踪

  • 新的检查点sam2.1_hiera_* 系列具有更好性能

  • 官方 pip 包 — 使用以下命令安装 pip install sam-2 (无需手动构建)

  • 更快的推理 — 优化的 CUDA 内核

资源

推荐硬件

组件
最低
推荐
最佳

GPU

RTX 3060 12GB

RTX 4080 16GB

RTX 4090 24GB

显存

8GB

16GB

24GB

CPU

4 核

8 核

16 核

内存

16GB

32GB

64GB

存储

30GB SSD

50GB NVMe

100GB NVMe

网络

100 Mbps

500 Mbps

1 Gbps

在 CLORE.AI 上快速部署

Docker 镜像:

端口:

命令:

访问您的服务

部署后,在以下位置查找您的 http_pub URL: 我的订单:

  1. 前往 我的订单 页面

  2. 单击您的订单

  3. 查找 http_pub URL(例如, abc123.clorecloud.net)

使用 https://YOUR_HTTP_PUB_URL 而不是 localhost 在下面的示例中。

安装

替代:从源码(用于开发)

您可以创建的内容

视频编辑

  • 从视频中移除对象

  • 无缝替换背景

  • 为合成创建视频掩码

体育分析

  • 跟踪比赛中的球员

  • 分析运动轨迹

  • 生成精彩集锦

医学影像

  • 对 CT/MRI 视频中的器官进行分割

  • 在显微镜下跟踪细胞运动

  • 测量随时间的生长

监控与安防

  • 跨摄像头跟踪对象

  • 计数人员/车辆

  • 异常检测

创意项目

  • VFX 的描绘抠像(Rotoscoping)

  • 交互式视频装置

  • AR/VR 内容创作

基本用法

图像分割

视频对象跟踪

多对象跟踪

框提示分割

Gradio 界面

导出掩码为视频

background = Image.open("studio_bg.jpg")

任务
分辨率
GPU
性能

图像分割

RTX 4090

速度

50 毫秒

图像分割

RTX 4090

512x512

30ms

视频(每帧)

720p

512x512

45ms

视频(每帧)

1080p

2s

35ms

模型变体(SAM2.1)

SAM2.1 引入了新的 sam2.1_hiera_* 在视频跟踪准确性上改进的检查点:

A100
参数量
显存
性能
质量
检查点

sam2.1_hiera_tiny

38M

4GB

最快

良好

sam2.1_hiera_tiny.pt

sam2.1_hiera_small

46M

5GB

快速

更好

sam2.1_hiera_small.pt

sam2.1_hiera_base_plus

80M

8GB

中等

很棒

sam2.1_hiera_base_plus.pt

sam2.1_hiera_large

224M

12GB

较慢

最佳

sam2.1_hiera_large.pt

注意: 在视频基准测试中,SAM2.1 模型在快速移动对象和长时间遮挡场景下持续优于其 SAM2 对应模型。

IC-Light-FBC

内存不足

与背景合成 长视频导致 CUDA 内存不足

光照未改变

跟踪丢失

与背景合成 对象跟踪在视频中途失败

光照未改变

  • 当跟踪漂移时添加校正点

  • 对初始分割使用框提示以获得更好效果

  • 选择更清晰的初始帧

处理缓慢

与背景合成 视频处理太慢

光照未改变

  • 使用更小的模型变体(tiny/small)

  • 降低视频分辨率

  • 启用半精度(fp16)

  • 在 A100 GPU 上处理

掩码质量差

与背景合成 分割边缘粗糙

光照未改变

  • 使用更大的模型(用 large 替代 tiny)

  • 添加更多点提示

  • 结合点提示和框提示

# 使用固定种子以获得一致结果

分割不准确

  • 更精确地点击目标对象

  • 添加多个正/负点

  • 对大对象使用框提示

视频内存错误

  • 一次处理更少帧

  • 降低视频分辨率

  • 对长视频使用流式模式

跟踪丢失

  • 当对象变化时添加更多提示

  • 使用记忆库功能

  • 检查对象是否被遮挡

处理缓慢

  • SAM2 计算量大

  • 对长视频使用 A100

  • 考虑跳帧处理

下载所有所需的检查点

检查文件完整性

GPU
验证 CUDA 兼容性
费用估算
CLORE.AI 市场的典型费率(截至 2024 年):

按小时费率

~$0.03

~$0.70

~$0.12

速度

~$0.06

~$1.50

~$0.25

512x512

~$0.10

~$2.30

~$0.40

按日费率

~$0.17

~$4.00

~$0.70

4 小时会话

~$0.25

~$6.00

~$1.00

RTX 3060 CLORE.AI 市场arrow-up-right A100 40GB

A100 80GB

  • 使用 竞价 价格随提供商和需求而异。请查看

  • 以获取当前费率。 CLORE 节省费用:

  • 市场用于灵活工作负载(通常便宜 30-50%)

使用以下方式支付

最后更新于

这有帮助吗?