Dépannage

Problèmes courants et solutions pour la location de GPU Clore.ai

Problèmes courants et solutions lors de la location de serveurs GPU sur la marketplace CLORE.AI.

Tous les exemples peuvent être exécutés sur des serveurs GPU loués via CLORE.AI Marketplace.

Ce guide est basé sur la documentation technique de la plateforme CLORE.AI.

Table des matières

Problèmes lors de la création de commande

La commande échoue : "Solde insuffisant"

Cause : Fonds insuffisants pour couvrir les frais de création et le dépôt minimum.

Solution :

Vérifiez votre solde dans la monnaie sélectionnée (CLORE, BTC ou USDT/USDC)
Les frais de création sont prélevés lorsque la commande est créée
Rechargez votre solde avec suffisamment pour plusieurs heures de location

La commande échoue : "Serveur non disponible"

Cause : Le serveur est déjà loué ou hors ligne.

Solution :

Actualisez la page du marketplace
Vérifiez le statut du serveur (indicateur en ligne/hors ligne)
Pour les locations Spot - vous avez peut‑être été surenchéri

Commande bloquée en statut "Création"

Cause : Le conteneur est en cours de déploiement ou une erreur s'est produite.

Solution :

Attendez 2-5 minutes (l'image Docker est en cours de téléchargement)
Vérifiez les logs dans Mes commandes
Les images volumineuses (10 Go+) prennent plus de temps à télécharger
Si bloqué plus de 10 minutes - annulez et réessayez

Problèmes de connexion

Impossible de se connecter via SSH

Cause : Port non configuré ou conteneur non prêt.

Liste de contrôle :

Le port 22 doit être défini comme TCP (pas HTTP)
Le statut du conteneur doit être Actif (pas Création)
Utilisez le port mappé correct depuis Mes commandes

Commande SSH correcte :

ssh -p <MAPPED_PORT> root@<PROXY_ADDRESS>

Où <MAPPED_PORT> est le port public (ex. 45678), PAS le port 22.

SSH fonctionne mais l'interface web ne s'ouvre pas

Cause : Port défini en TCP au lieu de HTTP, ou service non démarré.

Solution :

Les ports de l'interface web doivent être définis comme HTTP (pas TCP)
Le service doit écouter sur 0.0.0.0, pas localhost
Vérifiez les logs - le service a pu planter au démarrage

Configuration correcte des ports :

22/tcp      - Accès SSH
7860/http   - Interface Gradio/WebUI
8000/http   - Serveur API

Erreur "Connexion refusée"

Cause : Le service à l'intérieur du conteneur ne fonctionne pas ou écoute sur la mauvaise adresse.

Solution :

Connectez‑vous en SSH dans le conteneur et vérifiez le statut du service :
```
ps aux | grep python
netstat -tlnp
```

Le service doit écouter sur 0.0.0.0, pas 127.0.0.1:

# Incorrect :
python app.py --host 127.0.0.1

# Correct :
python app.py --host 0.0.0.0

Erreur "Délai d'attente de connexion dépassé"

Cause : Mauvaise adresse/port ou problèmes réseau.

Liste de contrôle :

Utilisez l'adresse Proxy depuis Mes commandes (pas l'IP du serveur !)
Utilisez le port mappé (port public, pas le port du conteneur)
Utilisez le protocole correct (http:// pour les ports HTTP)

Problèmes de conteneur

Le conteneur redémarre en boucle

Cause : Erreur dans la commande de démarrage ou ressources insuffisantes.

Solution :

Vérifiez les logs dans Mes commandes

Simplifiez la commande de démarrage :

# Mauvais - une longue commande peut échouer :
apt update && apt install -y ... && pip install ... && python ...

# Mieux - commencez avec une commande simple :
sleep infinity

Puis connectez‑vous en SSH et configurez manuellement

Impossible de réinitialiser le conteneur

Cause : Période de refroidissement entre les réinitialisations.

Fait : La réinitialisation du conteneur a un délai de 120 secondes de refroidissement.

Solution : Attendez 2 minutes entre les tentatives de réinitialisation.

Données perdues après redémarrage

Cause : Les données ne sont pas dans un stockage persistant.

Important :

Les données à l'intérieur du conteneur sont préservées lors de la réinitialisation du conteneur
Les données sont perdues lorsque la commande est annulée ou expire
Téléchargez toujours les résultats avant de terminer la location :
```
scp -P <port> root@<proxy>:/workspace/results.tar.gz ./
```

La commande de démarrage ne s'exécute pas

Cause : Erreur de syntaxe ou problème d'image.

Erreurs courantes :


# Erreur : espace en trop après \\
apt update && \\
apt install -y git   # <-- espace avant la ligne suivante

# Correct :
apt update && \\
apt install -y git && \\
python app.py

Solution :

Utilisez un démarrage simple : bash ou sleep infinity
Configurez tout via SSH
Ou créez une image Docker personnalisée avec le logiciel préinstallé

Problèmes GPU

GPU non visible dans le conteneur

Vérifiez :

nvidia-smi

Si commande introuvable :

L'image Docker doit prendre en charge CUDA
Utilisez des images compatibles CUDA : pytorch/pytorch:2.5.1-cuda12.4-cudnn9-runtime

Si le GPU n'est pas affiché :

Vérifiez que le serveur a un GPU (vérifiez la fiche du marketplace)
Contactez le fournisseur du serveur

Incompatibilité de version CUDA

Erreur : La version du pilote CUDA est insuffisante pour la version du runtime CUDA

Cause : La version de CUDA dans l'image est incompatible avec le pilote du serveur.

Solution :

Vérifiez la version du pilote : nvidia-smi (coin supérieur droit)
Utilisez une image avec une version de CUDA compatible
Choix sûrs : CUDA 11.8, CUDA 12.1

Plus de mémoire GPU disponible

Erreur : CUDA out of memory

Solutions :

Utilisez un modèle plus petit ou la quantification
Ajoutez des drapeaux d'optimisation mémoire :
- Stable Diffusion : --medvram ou --lowvram
- LLMs : load_in_4bit=True ou load_in_8bit=True
Libérez la mémoire : torch.cuda.empty_cache()
Louez un serveur avec plus de VRAM

Problèmes de paiement

Devises prises en charge

CLORE.AI prend en charge trois devises :

CLORE - le token natif de la plateforme
BTC - Bitcoin
USD - stablecoins (si activés par le fournisseur)

Commande annulée : "Surenchéri"

Cause : Quelqu'un a proposé un prix plus élevé sur le marché Spot.

Solution :

Utilisez À la demande pour une location garantie
Ou augmentez le prix de votre enchère Spot

Solde débité mais commande non créée

Cause : Les frais de création sont facturés même si la commande échoue.

Solution :

Les frais de création sont généralement minimes
Vérifiez la raison de l'annulation dans l'historique
Contactez le support pour les problèmes récurrents

Limites de la plateforme

Vérifié depuis la base de code CLORE.AI :

Paramètre

Limite

Ports par commande

Variables d'environnement totales

12 288 caractères (12 Ko)

Nom d'une seule variable d'env

128 caractères

Valeur d'une seule variable d'env

1 536 caractères

Clé SSH

3 072 caractères

Mot de passe SSH

32 caractères

Jeton Jupyter

32 caractères

Cooldown de réinitialisation du conteneur

120 secondes

Plage de ports

1-65535

Protocoles de ports

Uniquement TCP ou HTTP

Variables d'environnement

Utilisez des variables d'environnement pour l'accès SSH et Jupyter :

Variable

But

Longueur max

SSH_KEY

Votre clé SSH publique

3 072 caractères

SSH_PASSWORD

Mot de passe SSH

32 caractères

JUPYTER_TOKEN

Jeton du notebook Jupyter

32 caractères

Configuration d'exemple :

SSH_PASSWORD=mypassword123
JUPYTER_TOKEN=mysecrettoken

Commandes de diagnostic


# Vérifier le GPU
nvidia-smi

# Vérifier l'utilisation de la mémoire
free -h

# Vérifier l'espace disque
df -h

# Vérifier les processus en cours
ps aux | grep python

# Vérifier les ports ouverts
netstat -tlnp

# Vérifier les logs d'erreurs récents
dmesg | tail -50

# Libérer la mémoire GPU (Python)
import torch
torch.cuda.empty_cache()

Obtenir de l'aide

Si le problème persiste :

Vérifiez Documentation CLORE.AI
Décrivez le problème avec les logs et des captures d'écran
Incluez l'ID de la commande et l'ID du serveur

PrécédentTarification GPU SuivantAperçu

Mis à jour il y a 2 jours

Ce contenu vous a-t-il été utile ?

hashtagTable des matières

hashtagProblèmes lors de la création de commande

hashtagLa commande échoue : "Solde insuffisant"

hashtagLa commande échoue : "Serveur non disponible"

hashtagCommande bloquée en statut "Création"

hashtagProblèmes de connexion

hashtagImpossible de se connecter via SSH

hashtagSSH fonctionne mais l'interface web ne s'ouvre pas

hashtagErreur "Connexion refusée"

hashtagErreur "Délai d'attente de connexion dépassé"

hashtagProblèmes de conteneur

hashtagLe conteneur redémarre en boucle

hashtagImpossible de réinitialiser le conteneur

hashtagDonnées perdues après redémarrage

hashtagLa commande de démarrage ne s'exécute pas

hashtagProblèmes GPU

hashtagGPU non visible dans le conteneur

hashtagIncompatibilité de version CUDA

hashtagPlus de mémoire GPU disponible

hashtagProblèmes de paiement

hashtagDevises prises en charge

hashtagCommande annulée : "Surenchéri"

hashtagSolde débité mais commande non créée

hashtagLimites de la plateforme

hashtagVariables d'environnement

hashtagCommandes de diagnostic

hashtagObtenir de l'aide

Table des matières

Problèmes lors de la création de commande

La commande échoue : "Solde insuffisant"

La commande échoue : "Serveur non disponible"

Commande bloquée en statut "Création"

Problèmes de connexion

Impossible de se connecter via SSH

SSH fonctionne mais l'interface web ne s'ouvre pas

Erreur "Connexion refusée"

Erreur "Délai d'attente de connexion dépassé"

Problèmes de conteneur

Le conteneur redémarre en boucle

Impossible de réinitialiser le conteneur

Données perdues après redémarrage

La commande de démarrage ne s'exécute pas

Problèmes GPU

GPU non visible dans le conteneur

Incompatibilité de version CUDA

Plus de mémoire GPU disponible

Problèmes de paiement

Devises prises en charge

Commande annulée : "Surenchéri"

Solde débité mais commande non créée

Limites de la plateforme

Variables d'environnement

Commandes de diagnostic

Obtenir de l'aide