Mistral.rs
什么是 Mistral.rs?
主要功能
支持的模型系列
系列
格式
引擎
在 Clore.ai 上快速开始
步骤 1:查找 GPU 服务器
第 2 步:部署 Mistral.rs Docker
容器端口
用途
第 3 步:连接并验证
运行服务器
使用 GGUF 模型快速开始
提供 Mistral 7B(SafeTensors)
使用就地量化(ISQ)提供服务
视觉语言模型
投机性解码
API 使用
兼容 OpenAI 的端点
端点
方法
描述
Python 示例
流式响应
视觉/图像输入
cURL 示例
配置选项
服务器标志
ISQ 量化参考
ISQ 选项
位数
速度
显存(7B)
高级功能
X-LoRA(多个 LoRA 适配器的混合)
运行时重新量化
请求日志
性能调优
优化吞吐量
优化低延迟
监控性能
Docker Compose
从源码构建
故障排除
未找到 CUDA 库
模型下载失败
端口 8080 被占用
量化期间内存不足
Clore.ai 的 GPU 建议
GPU
显存(VRAM)
Clore.ai 价格
推荐使用
吞吐量(Mistral 7B Q4)
资源
最后更新于
这有帮助吗?