Dépannage

Problèmes courants et solutions pour la location de GPU Clore.ai

Problèmes courants et solutions lors de la location de serveurs GPU sur la marketplace CLORE.AI.

circle-check
circle-info

Ce guide est basé sur la documentation technique de la plateforme CLORE.AI.

Table des matières


Problèmes lors de la création de commande

La commande échoue : "Solde insuffisant"

Cause : Fonds insuffisants pour couvrir les frais de création et le dépôt minimum.

Solution :

  • Vérifiez votre solde dans la monnaie sélectionnée (CLORE, BTC ou USDT/USDC)

  • Les frais de création sont prélevés lorsque la commande est créée

  • Rechargez votre solde avec suffisamment pour plusieurs heures de location

La commande échoue : "Serveur non disponible"

Cause : Le serveur est déjà loué ou hors ligne.

Solution :

  • Actualisez la page du marketplace

  • Vérifiez le statut du serveur (indicateur en ligne/hors ligne)

  • Pour les locations Spot - vous avez peut‑être été surenchéri

Commande bloquée en statut "Création"

Cause : Le conteneur est en cours de déploiement ou une erreur s'est produite.

Solution :

  1. Attendez 2-5 minutes (l'image Docker est en cours de téléchargement)

  2. Vérifiez les logs dans Mes commandes

  3. Les images volumineuses (10 Go+) prennent plus de temps à télécharger

  4. Si bloqué plus de 10 minutes - annulez et réessayez


Problèmes de connexion

Impossible de se connecter via SSH

Cause : Port non configuré ou conteneur non prêt.

Liste de contrôle :

  1. Le port 22 doit être défini comme TCP (pas HTTP)

  2. Le statut du conteneur doit être Actif (pas Création)

  3. Utilisez le port mappé correct depuis Mes commandes

Commande SSH correcte :

<MAPPED_PORT> est le port public (ex. 45678), PAS le port 22.

SSH fonctionne mais l'interface web ne s'ouvre pas

Cause : Port défini en TCP au lieu de HTTP, ou service non démarré.

Solution :

  1. Les ports de l'interface web doivent être définis comme HTTP (pas TCP)

  2. Le service doit écouter sur 0.0.0.0, pas localhost

  3. Vérifiez les logs - le service a pu planter au démarrage

Configuration correcte des ports :

Erreur "Connexion refusée"

Cause : Le service à l'intérieur du conteneur ne fonctionne pas ou écoute sur la mauvaise adresse.

Solution :

  1. Connectez‑vous en SSH dans le conteneur et vérifiez le statut du service :

  2. Le service doit écouter sur 0.0.0.0, pas 127.0.0.1:

Erreur "Délai d'attente de connexion dépassé"

Cause : Mauvaise adresse/port ou problèmes réseau.

Liste de contrôle :

  1. Utilisez l'adresse Proxy depuis Mes commandes (pas l'IP du serveur !)

  2. Utilisez le port mappé (port public, pas le port du conteneur)

  3. Utilisez le protocole correct (http:// pour les ports HTTP)


Problèmes de conteneur

Le conteneur redémarre en boucle

Cause : Erreur dans la commande de démarrage ou ressources insuffisantes.

Solution :

  1. Vérifiez les logs dans Mes commandes

  2. Simplifiez la commande de démarrage :

  3. Puis connectez‑vous en SSH et configurez manuellement

Impossible de réinitialiser le conteneur

Cause : Période de refroidissement entre les réinitialisations.

Fait : La réinitialisation du conteneur a un délai de 120 secondes de refroidissement.

Solution : Attendez 2 minutes entre les tentatives de réinitialisation.

Données perdues après redémarrage

Cause : Les données ne sont pas dans un stockage persistant.

Important :

  • Les données à l'intérieur du conteneur sont préservées lors de la réinitialisation du conteneur

  • Les données sont perdues lorsque la commande est annulée ou expire

  • Téléchargez toujours les résultats avant de terminer la location :

La commande de démarrage ne s'exécute pas

Cause : Erreur de syntaxe ou problème d'image.

Erreurs courantes :

Solution :

  1. Utilisez un démarrage simple : bash ou sleep infinity

  2. Configurez tout via SSH

  3. Ou créez une image Docker personnalisée avec le logiciel préinstallé


Problèmes GPU

GPU non visible dans le conteneur

Vérifiez :

Si commande introuvable :

  • L'image Docker doit prendre en charge CUDA

  • Utilisez des images compatibles CUDA : pytorch/pytorch:2.5.1-cuda12.4-cudnn9-runtime

Si le GPU n'est pas affiché :

  • Vérifiez que le serveur a un GPU (vérifiez la fiche du marketplace)

  • Contactez le fournisseur du serveur

Incompatibilité de version CUDA

Erreur : La version du pilote CUDA est insuffisante pour la version du runtime CUDA

Cause : La version de CUDA dans l'image est incompatible avec le pilote du serveur.

Solution :

  • Vérifiez la version du pilote : nvidia-smi (coin supérieur droit)

  • Utilisez une image avec une version de CUDA compatible

  • Choix sûrs : CUDA 11.8, CUDA 12.1

Plus de mémoire GPU disponible

Erreur : CUDA out of memory

Solutions :

  1. Utilisez un modèle plus petit ou la quantification

  2. Ajoutez des drapeaux d'optimisation mémoire :

    • Stable Diffusion : --medvram ou --lowvram

    • LLMs : load_in_4bit=True ou load_in_8bit=True

  3. Libérez la mémoire : torch.cuda.empty_cache()

  4. Louez un serveur avec plus de VRAM


Problèmes de paiement

Devises prises en charge

CLORE.AI prend en charge trois devises :

  • CLORE - le token natif de la plateforme

  • BTC - Bitcoin

  • USD - stablecoins (si activés par le fournisseur)

Commande annulée : "Surenchéri"

Cause : Quelqu'un a proposé un prix plus élevé sur le marché Spot.

Solution :

  • Utilisez À la demande pour une location garantie

  • Ou augmentez le prix de votre enchère Spot

Solde débité mais commande non créée

Cause : Les frais de création sont facturés même si la commande échoue.

Solution :

  • Les frais de création sont généralement minimes

  • Vérifiez la raison de l'annulation dans l'historique

  • Contactez le support pour les problèmes récurrents


Limites de la plateforme

Vérifié depuis la base de code CLORE.AI :

Paramètre
Limite

Ports par commande

5

Variables d'environnement totales

12 288 caractères (12 Ko)

Nom d'une seule variable d'env

128 caractères

Valeur d'une seule variable d'env

1 536 caractères

Clé SSH

3 072 caractères

Mot de passe SSH

32 caractères

Jeton Jupyter

32 caractères

Cooldown de réinitialisation du conteneur

120 secondes

Plage de ports

1-65535

Protocoles de ports

Uniquement TCP ou HTTP


Variables d'environnement

Utilisez des variables d'environnement pour l'accès SSH et Jupyter :

Variable
But
Longueur max

SSH_KEY

Votre clé SSH publique

3 072 caractères

SSH_PASSWORD

Mot de passe SSH

32 caractères

JUPYTER_TOKEN

Jeton du notebook Jupyter

32 caractères

Configuration d'exemple :


Commandes de diagnostic


Obtenir de l'aide

Si le problème persiste :

  1. Décrivez le problème avec les logs et des captures d'écran

  2. Incluez l'ID de la commande et l'ID du serveur

Mis à jour

Ce contenu vous a-t-il été utile ?