# 租用者故障排除

在 Clore.ai 上租用 GPU 服务器时的常见问题及解决方案。

## 服务器连接问题

### 无法通过 SSH 连接

**症状：** 连接被拒绝、超时或权限被拒绝。

**解决方法：**

1. **等待服务器启动**
   * 新订单需要 2-5 分钟才能完全初始化
   * 在“我的订单”中检查订单状态 - 应显示“运行中”
2. **核实连接详情**
   * 从订单详情中再次确认 IP 地址和端口
   * 使用精确的命令格式： `ssh root@IP -p PORT`
3. **检查你的网络**
   * 尝试使用不同的网络（某些 ISP 会屏蔽特定端口）
   * 如果你的地区可用，使用 Clore VPN
4. **SSH 密钥问题**
   * 确保你的公钥已在账户 → SSH 密钥中添加
   * 如果密钥无效，尝试密码验证

### 服务器无响应

**症状：** 服务器之前可用但现在无响应。

**解决方法：**

1. **检查服务器状态** 在“我的订单”中
2. **等待 5-10 分钟** - 服务器可能正在重启
3. **联系主机** 如果问题持续，通过聊天联系
4. **请求退款** 如果服务器完全不可用

## GPU 问题

### 未检测到 GPU

**症状：** `nvidia-smi` 返回错误或未显示 GPU。

**解决方法：**

```bash
# 检查 NVIDIA 驱动是否已加载
lsmod | grep nvidia

# 重启 NVIDIA 服务
sudo systemctl restart nvidia-persistenced

# 检查驱动问题
dmesg | grep -i nvidia
```

如果仍未检测到 GPU：

1. 通过订单聊天联系主机
2. 通过支持请求重启服务器
3. 考虑结束订单并寻找其他服务器

### CUDA 错误

**症状：** CUDA 内存不足、版本不匹配等错误。

**解决方法：**

1. **检查 CUDA 版本兼容性**

   ```bash
   nvcc --version
   nvidia-smi
   ```
2. **释放 GPU 内存**

   ```bash
   # 查找占用 GPU 的进程
   nvidia-smi

   # 终止指定进程
   kill -9 <PID>
   ```
3. **使用合适的 Docker 镜像** 对应匹配的 CUDA 版本

### GPU 性能低于预期

**解决方法：**

1. 检查是否有其他进程正在使用 GPU： `nvidia-smi`
2. 确认 GPU 型号与列表一致
3. 在工作负载运行期间监控 GPU 利用率
4. 如果规格与宣传不符，请联系主机

## Docker / 容器问题

### 容器无法启动

**解决方法：**

1. **检查 Docker 状态**

   ```bash
   docker ps -a
   docker logs <container_id>
   ```
2. **重启 Docker 服务**

   ```bash
   sudo systemctl restart docker
   ```
3. **检查磁盘空间**

   ```bash
   df -h
   ```

### 缺少依赖项

**解决方法：**

1. 安装所需的软件包：

   ```bash
   apt-get update && apt-get install -y <package>
   ```
2. 使用 pip 安装 Python 包：

   ```bash
   pip install <package>
   ```
3. 考虑使用预装工具的不同 Docker 镜像

## 服务器上的网络问题

### 无法从服务器访问互联网

**解决方法：**

1. **检查 DNS**

   ```bash
   cat /etc/resolv.conf
   # 尝试添加 Google DNS
   echo "nameserver 8.8.8.8" >> /etc/resolv.conf
   ```
2. **测试连通性**

   ```bash
   ping 8.8.8.8
   curl -I https://google.com
   ```

### 端口不可访问

有些服务器有防火墙限制：

1. 在订单详情中检查哪些端口已开放
2. 对服务使用 SSH 端口转发
3. 如果需要特定端口开放，请联系主机

## 计费问题

### 收费高于预期

1. 检查订单历史以了解实际使用时长
2. 查看费用结构（按需与抢占/Spot 价格）
3. 考虑创建费用
4. 如果存在差异，带上订单 ID 联系支持

### 订单意外终止

**对于 Spot 订单：**

* 可能有其他用户出价超过你
* 这在 Spot 租用中是正常现象
* 使用按需订单以保证访问

**对于按需订单：**

* 检查余额是否充足
* 查看订单日志以了解终止原因
* 如不清楚，请联系支持

## 寻求帮助

### 联系主机

* 在你的订单详情中使用聊天功能
* 主机通常会在几小时内回复

### Clore.ai 支持

* Discord： [discord.gg/clore-ai](https://discord.gg/clore-ai)
* 对于技术问题使用 #support 频道

### 请求退款

如果服务器不符合宣传规格：

1. 记录问题（截图、日志）
2. 先联系主机
3. 如果未解决，携带证据联系 Clore.ai 支持


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/clore.ai/clore.ai-eng-zh/zhen-dui-zu-yong-zhe/renter-troubleshooting.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
