故障排除
Clore.ai GPU 租赁的常见问题和解决方案
在CLORE.AI市场租用GPU服务器时的常见问题及解决方案。
所有示例都可以在通过以下方式租用的 GPU 服务器上运行: CLORE.AI 市场.
本指南基于CLORE.AI平台技术文档。
目录
订单创建问题
订单失败:“余额不足”
原因: 资金不足以支付创建费用和最低押金。
解决方案:
检查您在所选货币(CLORE、BTC 或 USDT/USDC)中的余额
创建费用在订单创建时收取
充值余额,确保足够支付数小时的租用费用
订单失败:“服务器不可用”
原因: 服务器已被租用或处于离线状态。
解决方案:
刷新市场页面
检查服务器状态(在线/离线指示)
对于即刻(Spot)租用——您可能已被出价超过
订单卡在“创建中”状态
原因: 容器正在部署或发生错误。
解决方案:
等待2-5分钟(Docker镜像正在拉取)
检查日志(位于) 我的订单
大型镜像(10GB+)下载时间更长
如果卡住超过10分钟——取消并重试
连接问题
无法通过SSH连接
原因: 端口未配置或容器未就绪。
检查清单:
端口22必须设置为 TCP (不是HTTP)
容器状态必须是 活动 (不是创建中)
使用来自的正确映射端口 我的订单
正确的SSH命令:
其中 <MAPPED_PORT> 是公网端口(例如 45678),不是22端口。
SSH可用但网页界面无法打开
原因: 端口设置为TCP而非HTTP,或服务未运行。
解决方案:
网页界面端口必须设置为 HTTP (不是TCP)
服务必须监听于
0.0.0.0,而不是localhost检查日志——服务可能在启动时崩溃
正确的端口配置:
“连接被拒绝”错误
原因: 容器内的服务未运行或监听错误的地址。
解决方案:
SSH进入容器并检查服务状态:
服务必须监听于
0.0.0.0,而不是127.0.0.1:
“连接超时”错误
原因: 地址/端口错误或网络问题。
检查清单:
使用来自 的代理地址 我的订单 (不是服务器IP!)
使用映射端口(公网端口,而非容器端口)
使用正确的协议(HTTP端口使用 http://)
容器问题
容器持续重启
原因: 启动命令错误或资源不足。
解决方案:
检查日志(位于) 我的订单
简化启动命令:
然后SSH进入并手动配置
无法重置容器
原因: 重置之间存在冷却期。
事实: 重置容器具有一个 120 秒 冷却时间。
解决方案: 在重置尝试之间等待2分钟。
重启后数据丢失
原因: 数据未保存在持久存储中。
重要:
容器内的数据会在 重置时被保留 (Reset Container)
数据会在 订单被取消或过期时丢失 在结束租用前务必下载结果:
scp -P <port> root@<proxy>:/workspace/results.tar.gz ./
语法错误或镜像问题。
原因: 常见错误:
# 错误:在 \ 之后有多余空格
解决方案:
bash
通过SSH配置一切或sleep infinity或创建包含预装软件的自定义Docker镜像
GPU在容器内不可见
GPU问题
检查:
如果命令未找到:
Docker镜像必须支持 CUDA
使用启用 CUDA 的镜像:
如果未显示GPU:
pytorch/pytorch:2.5.1-cuda12.4-cudnn9-runtime
确认服务器是否配备GPU(检查市场列表)
联系服务器提供商
错误:
CUDA 版本不匹配
CUDA 驱动版本不足以支持 CUDA 运行时版本 镜像中的 CUDA 版本与服务器驱动不兼容。
原因: 检查驱动版本:
解决方案:
(右上角)
nvidia-smi使用与驱动兼容的镜像 CUDA 版本安全选择:CUDA 11.8、CUDA 12.1
GPU 内存不足
使用更小的模型或量化
CUDA 驱动版本不足以支持 CUDA 运行时版本 CUDA 内存不足(out of memory)
光照未改变
添加内存优化标志:
Stable Diffusion:
--medvram
--lowvram或大型语言模型(LLMs):load_in_8bit=True
load_in_4bit=True或清理内存:
租用具有更多显存的服务器
torch.cuda.empty_cache()支持的货币
支付问题
CLORE.AI 支持三种货币:
- 平台的原生代币
CLORE - 比特币
BTC - 美元
- 稳定币(如果由提供者启用) 订单取消:“被超越出价”
有人在现货市场出价更高。
原因: 以确保获得有保障的租用
解决方案:
使用 按需 或提高您的现货出价
余额被扣但订单未创建
即使订单失败也会收取创建费用。
原因: 创建费用通常很少
解决方案:
在历史记录中检查取消原因
对于反复出现的问题请联系客服支持
经从 CLORE.AI 代码库核实:
平台限制
限制
环境变量总长度
5
12,288 字符
(12KB) 单个环境变量名
128 字符
单个环境变量值
1,536 字符
SSH 密钥
3,072 字符
SSH 密码
32 字符
Jupyter 令牌
容器重置冷却时间
Jupyter 令牌
120 秒
端口范围
端口协议
1-65535
仅支持 TCP 或 HTTP
环境变量
使用环境变量进行 SSH 和 Jupyter 访问:
最大长度
您的公钥(SSH)
3,072 字符
SSH_PASSWORD
32 字符
32 字符
JUPYTER_TOKEN
Jupyter 笔记本令牌
示例配置:
JUPYTER_TOKEN
SSH_PASSWORD=mypassword123
# 检查内存使用情况
如果问题仍然存在:
CLORE.AI 文档
检查 描述问题并附上日志和截图
包括订单ID和服务器ID
最后更新于
这有帮助吗?