Échec de Docker

Problème Clore.ai marque le rig comme Échec de Docker et le maintient hors ligne, même si HiveOS fonctionne.

Symptômes

  • Une icône « Échec de Docker » est affichée dans le panneau Clore.

  • Dans le Mes serveurs section, les GPU sont affichés comme 0x Inconnu ou le nombre de GPU continue de changer.


Cause 1 : GPU ou riser instable

Clore ne peut pas initialiser un GPU s'il est déconnecté ou instable. Même si HiveOS voit le GPU, Clore ne peut pas l'utiliser → Échec de Docker.

Solution : Redémarrer et vérifier le matériel

  1. Vérifiez le GPU ou le riser, assurez-vous que tout est bien connecté.

  2. Redémarrez le rig :

reboot

Si l'erreur revient après le redémarrage, le problème vient probablement du GPU, de la carte mère ou des risers.


Cause 2 : Environnement Python corrompu (Miniconda)

Clore se bloque au démarrage si le répertoire /opt/clore-hosting/miniconda-env est corrompu.

Solution : Supprimer l'environnement et redémarrer

sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service

Cause 3 : L'installation des dépendances est bloquée

Si Clore ne démarre pas, cela peut être dû à une installation gelée des dépendances (p. ex. aiofiles, docker, etc.).

Solution : Réinstaller les dépendances

sudo /opt/clore-hosting/clore.sh --reinstall

Cause 4 : Version de Docker instable installée (p. ex., 28.*)

Version recommandée : 27.5.1 Des plantages sont fréquents avec Docker 28+.

Solution : Rétrograder Docker

sudo apt install \
docker-ce=5:27.5.1-1~ubuntu.22.04~jammy \
docker-ce-cli=5:27.5.1-1~ubuntu.22.04~jammy \
containerd.io -y

Cause 5 : Les services requis ne sont pas activés au démarrage

Après le redémarrage, le système ne lance pas Docker et Clore Hosting → le serveur passe hors ligne.

Solution : Activer les services au démarrage

sudo systemctl enable clore-hosting.service
sudo systemctl enable docker.service
sudo systemctl enable docker.socket

Cause 6 : Le pilote ne détecte pas les GPU (nvidia-smi → Aucun périphérique trouvé)

Si HiveOS ne détecte pas le GPU, Clore ne peut pas travailler avec lui → entraîne un échec de Docker.

Solution : Réinstaller le pilote

nvidia-driver-update --force

Si le problème persiste — supprimez complètement le serveur de Clore, changez le token et ré-ajoutez-le.

Cela aide souvent si les configurations internes sont corrompues.


Échec de Docker signifie presque toujours que Clore ne voit pas le GPU. Dans 90 % des cas, la cause est soit un service désactivé soit un GPU/des risers instables. Réparez le problème de fond, activez les services au démarrage — et votre rig restera en ligne.

Mis à jour

Ce contenu vous a-t-il été utile ?