Сбой Docker

Проблема Clore.ai помечает риг как Сбой Docker и держит его в офлайне, хотя HiveOS работает.

Симптомы

  • В панели Clore отображается значок «Сбой Docker».

  • В Мои серверы разделе, GPU отображаются как 0x Неизвестно или количество GPU постоянно меняется.


Причина 1: Нестабильный GPU или райзер

Clore не может инициализировать GPU, если он отключен или нестабилен. Даже если HiveOS видит GPU, Clore не может его использовать → Сбой Docker.

Решение: Перезапуск и проверка оборудования

  1. Проверьте GPU или райзер, убедитесь, что все надежно подключено.

  2. Перезагрузите риг:

reboot

Если ошибка возвращается после перезагрузки, проблема, вероятно, в GPU, материнской плате или райзерах.


Причина 2: Повреждённое окружение Python (Miniconda)

Clore зависает при запуске, если каталог /opt/clore-hosting/miniconda-env повреждён.

Решение: Удалите окружение и перезапустите

sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service

Причина 3: Установка зависимостей зависла

Если Clore не запускается, это может быть из-за зависшей установки зависимостей (например, aiofiles, docker и т.д.).

Решение: Переустановите зависимости


Причина 4: Установлена нестабильная версия Docker (например, 28.*)

Рекомендуемая версия: 27.5.1 Сбои часто происходят с Docker 28+.

Решение: Понизьте версию Docker


Причина 5: Не все необходимые сервисы включены при старте

После перезагрузки система не запускает Docker и Clore Hosting → сервер уходит в офлайн.

Решение: Включите сервисы при загрузке


Причина 6: Драйвер не обнаруживает GPU (nvidia-smi → Устройства не найдены)

Если HiveOS не обнаруживает GPU, Clore не может работать с ним → это приводит к Сбою Docker.

Решение: Переустановите драйвер


Если проблема сохраняется — полностью удалите сервер из Clore, смените токен и добавьте его заново.

Это часто помогает, если внутренние конфиги повреждены.


Сбой Docker почти всегда означает, что Clore не видит GPU. В 90% случаев, причиной либо является отключённый сервис, либо нестабильный GPU/райзеры. Устраните корневую причину, включите сервисы при старте — и ваш риг останется в сети.

Последнее обновление

Это было полезно?