Échec de Docker

Problème Clore.ai marque le rig comme Échec de Docker et le maintient hors ligne, même si HiveOS fonctionne.

Symptômes

  • Une icône « Échec de Docker » est affichée dans le panneau Clore.

  • Dans le Mes serveurs section, les GPU sont affichés comme 0x Inconnu ou le nombre de GPU continue de changer.


Cause 1 : GPU ou riser instable

Clore ne peut pas initialiser un GPU s'il est déconnecté ou instable. Même si HiveOS voit le GPU, Clore ne peut pas l'utiliser → Échec de Docker.

Solution : Redémarrer et vérifier le matériel

  1. Vérifiez le GPU ou le riser, assurez-vous que tout est bien connecté.

  2. Redémarrez le rig :

reboot

Si l'erreur revient après le redémarrage, le problème vient probablement du GPU, de la carte mère ou des risers.


Cause 2 : Environnement Python corrompu (Miniconda)

Clore se bloque au démarrage si le répertoire /opt/clore-hosting/miniconda-env est corrompu.

Solution : Supprimer l'environnement et redémarrer

sudo systemctl stop clore-hosting.service
sudo rm -rf /opt/clore-hosting/miniconda-env
sudo systemctl start clore-hosting.service

Cause 3 : L'installation des dépendances est bloquée

Si Clore ne démarre pas, cela peut être dû à une installation gelée des dépendances (p. ex. aiofiles, docker, etc.).

Solution : Réinstaller les dépendances


Cause 4 : Version de Docker instable installée (p. ex., 28.*)

Version recommandée : 27.5.1 Des plantages sont fréquents avec Docker 28+.

Solution : Rétrograder Docker


Cause 5 : Les services requis ne sont pas activés au démarrage

Après le redémarrage, le système ne lance pas Docker et Clore Hosting → le serveur passe hors ligne.

Solution : Activer les services au démarrage


Cause 6 : Le pilote ne détecte pas les GPU (nvidia-smi → Aucun périphérique trouvé)

Si HiveOS ne détecte pas le GPU, Clore ne peut pas travailler avec lui → entraîne un échec de Docker.

Solution : Réinstaller le pilote


Si le problème persiste — supprimez complètement le serveur de Clore, changez le token et ré-ajoutez-le.

Cela aide souvent si les configurations internes sont corrompues.


Échec de Docker signifie presque toujours que Clore ne voit pas le GPU. Dans 90 % des cas, la cause est soit un service désactivé soit un GPU/des risers instables. Réparez le problème de fond, activez les services au démarrage — et votre rig restera en ligne.

Mis à jour

Ce contenu vous a-t-il été utile ?