# Docker 失败

**问题**\
Clore.ai 将算力机标记为 *Docker 故障* 并保持离线，即使 HiveOS 正在运行。

**症状**

* Clore 面板中显示“Docker 故障”图标。
* 在 **我的服务器** 部分，显卡显示为 *0x 未知* 或显卡数量不断变化。

***

**原因 1：显卡或转接线不稳定**

如果显卡断开或不稳定，Clore 无法初始化该显卡。\
即使 HiveOS 能看到显卡，Clore 也无法使用它 → **Docker 故障**.

**解决方案：重启并检查硬件**

1. 检查显卡或转接线，确保所有连接稳固。
2. 重启算力机：

```
reboot
```

如果重启后错误仍然出现，问题很可能出在显卡、主板或转接线。

***

#### 原因 2：Python 环境（Miniconda）损坏

如果目录 `/opt/clore-hosting/miniconda-env` 损坏，Clore 启动时会卡住。

**解决方案：删除环境并重启**

```
sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service
```

***

#### 原因 3：依赖项安装卡住

如果 Clore 无法启动，可能是因为依赖项（如 aiofiles、docker 等）的安装冻结。

**解决方案：重新安装依赖项**

```
sudo /opt/clore-hosting/clore.sh --reinstall
```

***

#### 原因 4：安装了不稳定的 Docker 版本（例如 28.\*）

推荐版本： **27.5.1**\
Docker 28 及以上版本经常发生崩溃。

**解决方案：降级 Docker**

```bash
sudo apt install \
docker-ce=5:27.5.1-1~ubuntu.22.04~jammy \
docker-ce-cli=5:27.5.1-1~ubuntu.22.04~jammy \
containerd.io -y
```

***

#### 原因 5：启动时未启用所需服务

重启后，系统未启动 Docker 和 Clore Hosting → 服务器离线。

**解决方案：启用开机启动的服务**

```
sudo systemctl enable clore-hosting.service
sudo systemctl enable docker.service
sudo systemctl enable docker.socket
```

***

#### 原因 6：驱动未检测到显卡（`nvidia-smi → 未发现设备`)

如果 HiveOS 无法检测到显卡，Clore 无法与其配合 → 导致 Docker 故障。

**解决方案：重新安装驱动**

```
nvidia-driver-update --force
```

***

#### 如果问题仍然存在 — 从 Clore 完全移除服务器，更换令牌并重新添加。

如果内部配置损坏，这通常会有帮助。

***

<mark style="color:蓝色;">**Docker 故障**</mark> <mark style="color:蓝色;"></mark><mark style="color:蓝色;">几乎总是意味着</mark> <mark style="color:蓝色;"></mark><mark style="color:蓝色;">**Clore 无法看到显卡**</mark><mark style="color:蓝色;">。</mark>\ <mark style="color:蓝色;">在</mark> <mark style="color:蓝色;"></mark><mark style="color:蓝色;">**90% 的情况下**</mark><mark style="color:蓝色;">，原因要么是服务被禁用，要么是显卡/转接线不稳定。</mark>\ <mark style="color:蓝色;">修复根本问题，在启动时启用服务 — 你的算力机就会保持在线。</mark>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/clore.ai/clore.ai-eng-zh/zhen-dui-zhu-ji/server-offline-on-clore.ai/docker-failure.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
