Docker 故障

问题 Clore.ai 将矿机标记为 Docker 故障 并将其保持离线，即使 HiveOS 正在运行。

症状

原因 1：GPU 或 Riser 不稳定

如果 GPU 断开或不稳定，Clore 无法初始化该 GPU。即使 HiveOS 能检测到 GPU，Clore 也无法使用它 → Docker 故障.

解决方案：重启并检查硬件

reboot

如果重启后错误再次出现，问题很可能出在 GPU、主板或 riser。

如果目录 /opt/clore-hosting/miniconda-env 被损坏，Clore 在启动时会挂起。

解决方案：删除环境并重启

sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service

如果 Clore 无法启动，可能是由于依赖项安装被冻结（例如 aiofiles、docker 等）。

解决方案：重新安装依赖项

sudo /opt/clore-hosting/clore.sh --reinstall

推荐版本： 27.5.1 Docker 28+ 经常发生崩溃。

解决方案：降级 Docker

sudo apt install \
docker-ce=5:27.5.1-1~ubuntu.22.04~jammy \
docker-ce-cli=5:27.5.1-1~ubuntu.22.04~jammy \
containerd.io -y

重启后，系统未启动 Docker 和 Clore Hosting → 服务器离线。

解决方案：在启动时启用服务

sudo systemctl enable clore-hosting.service
sudo systemctl enable docker.service
sudo systemctl enable docker.socket

如果 HiveOS 无法检测到 GPU，Clore 无法使用它 → 导致 Docker 故障。

解决方案：重新安装驱动

nvidia-driver-update --force

如果内部配置损坏，这通常会有帮助。

Docker 故障 几乎总是意味着 Clore 看不到该 GPU。在 90% 的情况下，原因要么是服务被禁用，要么是 GPU/risers 不稳定。修复根本问题，在启动时启用服务——你的矿机就会保持在线。

最后更新于5个月前

这有帮助吗？