# 视觉模型

- [概览](/guides/guides_v2-zh/shi-jue-mo-xing/vision-models.md)
- [Llama 3.2 Vision](/guides/guides_v2-zh/shi-jue-mo-xing/llama-vision.md): 在 Clore.ai 上运行 Meta 的 Llama 3.2 Vision 进行图像理解
- [LLaVA](/guides/guides_v2-zh/shi-jue-mo-xing/llava-vision-language.md): 在 Clore.ai 上使用 LLaVA 视觉语言模型与图像对话
- [Qwen2.5-VL 视觉语言模型](/guides/guides_v2-zh/shi-jue-mo-xing/qwen-vl.md): 在 Clore.ai 的 GPU 上运行 Qwen2.5-VL——领先的开源视觉语言模型，用于图像/视频/文档理解。
- [Florence-2](/guides/guides_v2-zh/shi-jue-mo-xing/florence2.md): 用于图像描述、检测和分割的 Microsoft Florence-2
- [SAM2 视频](/guides/guides_v2-zh/shi-jue-mo-xing/sam2-video.md): 在 Clore.ai 上使用 Meta 的 SAM2 跟踪并分割视频中的对象
- [GroundingDINO](/guides/guides_v2-zh/shi-jue-mo-xing/groundingdino.md): 使用文本描述检测任何对象，使用 GroundingDINO
