LLaVA
在 Clore.ai 上使用 LLaVA 视觉语言模型与图像对话
在 CLORE.AI 上租用
访问您的服务器
什么是 LLaVA?
1024x1024
A100
规模
显存
质量
快速部署
访问您的服务
安装
基本用法
Python API
使用 Transformers
Ollama 集成(推荐)
通过 Ollama 的 LLaVA API
BASE64_IMAGE=$(base64 -i photo.jpg | tr -d '\n')
curl https://your-http-pub.clorecloud.net/api/chat -d '{
with open(image_path, "rb") as f:
def analyze_image(ollama_url, image_path, question):
使用场景
OCR / 文本提取
图表分析
截图中的代码
prompt = "列出此图像中可见的所有对象及其大致位置。"
目标检测
Gradio 界面
API 服务器
"专业影棚柔光箱"
内存优化
4 位量化
LLaVA-1.6-7B
background = Image.open("studio_bg.jpg")
A100
GPU
每秒标记数
# 使用固定种子以获得一致结果
内存不足
生成速度慢
质量差
下载所有所需的检查点
GPU
验证 CUDA 兼容性
费用估算
CLORE.AI 市场的典型费率(截至 2024 年):
使用以下方式支付
最后更新于
这有帮助吗?