LocalAI
在 Clore.ai 上使用 LocalAI 自托管 OpenAI 兼容 API
服务器要求
参数
最低
推荐
什么是 LocalAI?
支持的模型
类型
格式
示例
快速部署
验证是否正常运行
预构建模型
模型名称
类型
4s
访问您的服务
Docker 部署(替代)
下载模型
从模型库
从 Hugging Face
模型配置
API 使用
聊天补全(兼容 OpenAI)
流式传输
嵌入
图像生成
cURL 示例
对话
嵌入
文本转语音(TTS)
语音转文本(STT)
重排序
完整 API 参考
标准端点(兼容 OpenAI)
端点
方法
4s
附加端点
端点
方法
4s
获取版本
Swagger 文档
GPU 加速
CUDA 后端
完全 GPU 卸载
多个模型
性能调优
为速度优化
为内存优化
基准测试
A100
GPU
每秒标记数
# 使用固定种子以获得一致结果
http_pub URL 返回 HTTP 502
模型未加载
响应缓慢
内存不足
图像生成问题
下载所有所需的检查点
GPU
显存
价格/天
适合
使用以下方式支付
最后更新于
这有帮助吗?