租户故障排除

在 Clore.ai 上租用 GPU 服务器时的常见问题及解决方案。

服务器连接问题

无法通过 SSH 连接

症状: 连接被拒绝、超时或权限被拒绝。

解决方法:

  1. 等待服务器启动

    • 新订单需要 2-5 分钟才能完全初始化

    • 在“我的订单”中检查订单状态——应显示为“运行中”

  2. 验证连接详情

    • 从订单详情中仔细核对 IP 地址和端口

    • 使用精确的命令格式: ssh root@IP -p PORT

  3. 检查你的网络

    • 尝试在不同的网络下连接(某些 ISP 会阻止特定端口)

    • 如果你所在地区可用,使用 Clore VPN

  4. SSH 密钥问题

    • 确保你的公钥已添加到账户 → SSH 密钥中

    • 如果密钥不起作用,尝试密码认证

服务器无响应

症状: 服务器之前可用但现在无响应。

解决方法:

  1. 检查服务器状态 在我的订单中

  2. 等待 5-10 分钟 - 服务器可能正在重启

  3. 联系主机 如果问题持续,通过聊天联系

  4. 请求退款 如果服务器完全不可用

GPU 问题

未检测到 GPU

症状: nvidia-smi 返回错误或未显示 GPU。

解决方法:

如果仍未检测到 GPU:

  1. 通过订单聊天联系主机

  2. 通过支持请求服务器重启

  3. 考虑结束订单并寻找其他服务器

CUDA 错误

症状: CUDA 内存不足、版本不匹配等错误。

解决方法:

  1. 检查 CUDA 版本兼容性

  2. 释放 GPU 内存

  3. 使用合适的 Docker 镜像 其 CUDA 版本应相匹配

GPU 性能低于预期

解决方法:

  1. 检查是否有其他进程在使用 GPU: nvidia-smi

  2. 核实 GPU 型号是否与列表一致

  3. 在工作负载运行时监控 GPU 利用率

  4. 如果规格与宣传不符,联系主机

Docker / 容器问题

容器无法启动

解决方法:

  1. 检查 Docker 状态

  2. 重启 Docker 服务

  3. 检查磁盘空间

缺少依赖项

解决方法:

  1. 安装所需的软件包:

  2. 对于 Python 包使用 pip:

  3. 考虑使用预装工具的不同 Docker 镜像

服务器网络问题

无法从服务器访问互联网

解决方法:

  1. 检查 DNS

  2. 测试连通性

端口无法访问

某些服务器有限制防火墙:

  1. 在订单详情中检查哪些端口已开放

  2. 对服务使用 SSH 端口转发

  3. 如果你需要打开特定端口,请联系主机

计费问题

收费超过预期

  1. 检查订单历史以查看实际使用时长

  2. 查看费用结构(按需与抢占/竞价费率)

  3. 考虑创建费用

  4. 如果存在差异,携订单 ID 联系支持

订单意外终止

对于抢占/竞价订单:

  • 可能有其他用户出价超过你

  • 这在抢占租用中是正常的

  • 使用按需以保证访问

对于按需订单:

  • 检查余额是否充足

  • 查看订单日志以查找终止原因

  • 如果不清楚,联系支持

寻求帮助

联系主机

  • 在你的订单详情中使用聊天功能

  • 主机通常会在几小时内回复

Clore.ai 支持

请求退款

如果服务器不符合宣传的规格:

  1. 记录问题(截图、日志)

  2. 先联系主机

  3. 如果未解决,携证据联系 Clore.ai 支持

最后更新于

这有帮助吗?