Échec de Docker

Problème Clore.ai marque le rig comme Échec Docker et le maintient hors ligne, même si HiveOS fonctionne.

Symptômes

  • Une icône « Échec Docker » est affichée dans le panneau Clore.

  • Dans Mes serveurs section, les GPU sont affichés comme 0x Inconnu ou le nombre de GPU continue de changer.


Cause 1 : GPU ou riser instable

Clore ne peut pas initialiser un GPU s'il est déconnecté ou instable. Même si HiveOS voit le GPU, Clore ne peut pas l'utiliser → Échec Docker.

Solution : Redémarrer et vérifier le matériel

  1. Vérifiez le GPU ou le riser, assurez-vous que tout est correctement connecté.

  2. Redémarrez le rig :

reboot

Si l'erreur revient après le redémarrage, le problème vient probablement du GPU, de la carte mère ou des risers.


Cause 2 : environnement Python corrompu (Miniconda)

Clore se bloque au démarrage si le répertoire /opt/clore-hosting/miniconda-env est corrompu.

Solution : Supprimer l'environnement et redémarrer

sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service

Cause 3 : l'installation des dépendances est bloquée

Si Clore ne démarre pas, cela peut être dû à une installation gelée des dépendances (p.ex. aiofiles, docker, etc.).

Solution : Réinstaller les dépendances


Cause 4 : version de Docker installée instable (p.ex. 28.*)

Version recommandée : 27.5.1 Les plantages sont courants avec Docker 28+.

Solution : Rétrograder Docker


Cause 5 : services requis non activés au démarrage

Après le redémarrage, le système ne lance pas Docker et Clore Hosting → le serveur passe hors ligne.

Solution : Activer les services au démarrage


Cause 6 : le pilote ne détecte pas les GPU (nvidia-smi → Aucun périphérique trouvé)

Si HiveOS ne détecte pas le GPU, Clore ne peut pas travailler avec lui → cela entraîne un Échec Docker.

Solution : Réinstaller le pilote


Si le problème persiste — supprimez complètement le serveur de Clore, changez le token et réajoutez-le.

Cela aide souvent si les configurations internes sont corrompues.


Échec Docker presque toujours signifie que Clore ne voit pas le GPU. Dans 90% des cas, la cause est soit un service désactivé soit un GPU/risers instable. Corrigez la cause principale, activez les services au démarrage — et votre rig restera en ligne.

Mis à jour

Ce contenu vous a-t-il été utile ?