Aphrodite 引擎
在 Clore.ai 上为传统与现代 GPU 运行 Aphrodite 引擎进行大型语言模型推理
服务器要求
参数
最低要求
推荐配置
在 CLORE.AI 上快速部署
变量
示例
描述
逐步设置
1. 在 CLORE.AI 上租用 GPU 服务器
2. 通过 SSH 连接
3. 拉取 Aphrodite 引擎镜像
4. 启动 Aphrodite 引擎
5. 验证服务器
6. 通过 CLORE.AI HTTP 代理访问
使用示例
示例 1:兼容 OpenAI 的聊天
示例 2:使用 Mirostat 的高级采样
示例 3:与 Kobold 兼容的 API
示例 4:带自定义采样器的 Python 客户端
示例 5:批量完成请求
invokeai.yaml 配置文件
主要启动参数
参数
默认
描述
添加 API 密钥认证
加载本地模型
1. 使用 SDXL-Turbo 或 SDXL-Lightning 以实现快速生成
1. 为你的 GPU 选择合适的量化方案
GPU 显存
7B 模型
13B 模型
30B 模型
2. 调整 GPU 内存利用率
3. 在 Ampere 及更新 GPU 上使用 bfloat16
4. 针对角色扮演/创意写作进行优化
5. Pascal GPU 提示(GTX 10xx)
故障排除
问题:"CUDA capability sm_6x not supported"
问题:小显卡上出现“内存不足”
问题:令牌生成速度慢
问题:找不到模型 / 404 错误
问题:输出重复性高
问题:Docker 容器静默退出
文档
Clore.ai 的 GPU 建议
在 Clore.ai 上的预估费用
开发/测试
RTX 3090(24GB)
最后更新于
这有帮助吗?