Page cover

Installation du logiciel

Exigences du serveur

Le serveur (ou rig – ces termes sont presque interchangeables dans ce contexte) doit être équipé de GPU NVIDIA, car AMD n'est actuellement pas pris en charge. L'espace disque minimum requis est de 32 Go ; pour plus de fiabilité, il est recommandé d'utiliser un SSD plutôt qu'une clé USB. Un minimum de 8 Go de RAM est requis, mais 16 Go offriront une plus grande stabilité. En ce qui concerne le processeur, le système peut fonctionner avec un Celeron sur socket 1151, mais pour des performances plus efficaces, envisagez d'utiliser un processeur comme l'i7-6700.

Avant de continuer, il est fortement recommandé de désactiver tout overclocking, y compris la limite de puissance (Power Limit, PL), et de réinitialiser les GPU aux paramètres d'usine. Ensuite, soumettez le système à un test de résistance pour vérifier la stabilité en, par exemple, testant les GPU avec l'algorithme kawpow et en sollicitant le CPU. Surveillez les températures et assurez-vous que tout fonctionne de manière stable.

Si le système fonctionne de manière stable et que les températures sont dans une plage sûre, passez à l'étape suivante des instructions. Si les températures sont trop élevées ou que des erreurs se produisent, corrigez d'abord ces problèmes – par exemple en améliorant le refroidissement ou en dépannant – et assurez une exploitation stable avant de poursuivre.

Pilotes recommandés et CUDA (HiveOS)

HiveOS inclut sa propre gestion des pilotes via la nvidia-driver-update commande. Pour une compatibilité optimale avec les charges de travail Clore.ai (en particulier ML/IA), utilisez les versions recommandées suivantes :

Pilotes NVIDIA

Branche
Version
Prise en charge CUDA
Recommandé pour

R580 (LTSB)

580.126.18

Jusqu'à CUDA 12.8

La plupart des GPU — stable, support à long terme jusqu'en août 2028

R590

590.48.01

Jusqu'à CUDA 13.1

Série RTX 50 (5090/5080), dernières fonctionnalités

Pour installer une version spécifique dans HiveOS :

nvidia-driver-update 580.126.18 --force

Pour les GPU de la série RTX 50 :

nvidia-driver-update 590.48.01 --force

Important : Ne pas utiliser nvidia-driver-update --force sans spécifier de version — cela peut installer un pilote par défaut plus ancien qui ne prend pas en charge les charges de travail CUDA modernes.

Compatibilité du Toolkit CUDA

La plupart des locataires utilisent des images Docker qui incluent leur propre runtime CUDA, donc les hôtes n'ont généralement pas besoin d'installer manuellement le Toolkit CUDA. Cependant, le pilote NVIDIA de l'hôte doit prendre en charge la version CUDA requise par la charge de travail du locataire.

Version CUDA
Pilote minimum
Statut

CUDA 12.4

R550+

Largement utilisé dans l'écosystème ML

CUDA 12.8

R570+

Dernière branche stable 12.x

CUDA 13.1

R590+

Dernière version, optimisée pour la série RTX 50

Recommandation : Installez R580 LTSB (580.126.18) pour une large compatibilité avec les charges de travail CUDA 12.x. Si vous hébergez des GPU de la série RTX 50, utilisez R590 (590.48.01) pour une prise en charge complète de CUDA 13.x.

Enregistrement et ajout du serveur

1. Allez sur le site webarrow-up-right, inscrivez-vous, connectez-vous et accédez au marketplace :

2. Ajout d'un serveur : Il existe deux façons d'ajouter un serveur :

Méthode 1 : Allez dans la section « Mes serveurs » et cliquez sur le bouton "+Ajouter un serveur". Entrez le nom du serveur et cliquez sur « Suivant ».

Après l'ajout, le serveur sera marqué d'un cercle rouge, ce qui signifie qu'il est inactif. Nous l'activerons plus tard, mais pour l'instant, cliquez sur le serveur créé pour obtenir une clé – vous en aurez besoin plus tard.

3. Configuration de HiveOS :

Choisissez le rig et ouvrez le Shell. Pour ceux qui utilisent rarement HiveOS, des images ont été ajoutées ci-dessous pour plus de clarté.

4. Mise à jour de HiveOS : Exécutez la commande :

Si des problèmes d'espace disque HiveOS surviennent : S'il y a moins d'espace libre sur le disque que prévu après l'installation ou la mise à jour (par ex., seulement 20 Go libres sur un disque de 512 Go), exécutez ce qui suit :

  • Pour M.2 :

  • Pour SATA :

5. Exécutez les mises à jour dans l'ordre :

6. Mettre à jour les pilotes nécessaires :

Astuce : Pour installer une version de pilote recommandée spécifique, utilisez :

Pour les GPU de la série RTX 50, utilisez la version 590.48.01 ou ultérieure.

7. Redémarrez le rig :

8. Passez en mode superutilisateur :

9. Installez le logiciel :

Si le système indique que git est manquant, installez-le avec :

Puis réessayez l'installation.

Si vous rencontrez une erreur gpg , utilisez :

Ensuite, relancez l'installation.

10. Activez le serveur :

Remplacez <token> par la clé obtenue précédemment.

Si une erreur indique qu'un dossier ou un fichier est manquant, l'installation s'est probablement mal terminée et le clore-hosting dossier n'a pas été créé. Dans ce cas, répétez l'installation.

11. Reboot final :

Redémarrez le rig, attendez un instant et actualisez la page du marketplace. Si tout a été configuré correctement, le serveur sera indiqué par un cercle vert.

Comment désactiver tous les services installés

Si vous devez désactiver tout ce qui a été installé auparavant :

  1. Désactivez les services :

  2. Redémarrez le système :

Comment réactiver les services

Pour réactiver les services :

  1. Activez les services :

  2. Redémarrez le système :

Suppression du token précédemment installé

Pour supprimer le token, utilisez la commande :

Le fichier contenant le token se trouve à :

Mis à jour

Ce contenu vous a-t-il été utile ?