LiteLLM AI 网关
在 Clore.ai GPU 上部署 LiteLLM 作为 100+ 大型语言模型的 AI 网关代理
服务器要求
参数
最低要求
推荐配置
在 CLORE.AI 上快速部署
变量
示例
描述
逐步设置
1. 在 CLORE.AI 上租用服务器
2. SSH 登录到您的服务器
3. 创建配置文件
4. 启动 LiteLLM
5. 验证服务器
6. 通过 CLORE.AI HTTP 代理访问
使用示例
示例 1:通过代理的直接 API 调用
示例 2:使用 LiteLLM 代理的 OpenAI Python SDK
示例 3:LiteLLM Python SDK(直接)
示例 4:回退配置
示例 5:费用跟踪仪表盘
invokeai.yaml 配置文件
虚拟密钥(每用户 API 密钥)
负载均衡
缓存
速率限制
1. 使用 SDXL-Turbo 或 SDXL-Lightning 以实现快速生成
1. 为重复提示启用缓存
2. 使用异步请求
3. 本地模型路由
4. 设置超时和重试
Clore.ai 的 GPU 建议
本地模型
GPU
为什么
故障排除
问题:"找不到模型"
问题:"认证失败"
问题:配置更改未生效
问题:首次请求延迟高
问题:数据库连接错误
问题:来自提供商的 429 速率限制错误
Clore.ai 的 GPU 建议
设置
GPU
Clore.ai 价格
在 Clore.ai 上的预估费用
文档
最后更新于
这有帮助吗?