Bare metal
Clore Bare Metal — Exigences et guide
Clore Bare Metal sont des serveurs physiques (non virtualisés) avec accès root complet, sans partage et sans limites d'alimentation. Convient pour l'IA/ML, le HPC, le rendu 3D et toute charge de travail lourde.
GPUs disponibles (exemples) : B200, H100, H200, A100, L40S, RTX 5090, RTX 4090, etc. Localisations (départ) : États-Unis, Japon, Hong Kong et autres SLA : Centres de données de niveau Tier 3 et plus, disponibilité cible 99.99%.
1) Qu'est-ce que le Bare Metal chez Clore
Vous obtenez une machine physique entière (CPU, RAM, disques, réseau, GPU).
Accès root/SSH complet et, lorsque disponible, IPMI/KVM pour la réinstallation du système d'exploitation.
Pas de limites PL / couches d'isolation — les performances correspondent au matériel.
Diffère des locations basées sur des conteneurs (HiveOS/Docker) en ce que les ressources ne sont pas partagées.
2) Exigences d'infrastructure obligatoires (pour les fournisseurs)
2.1 Centre de données
Minimum Tier 3 (Uptime Institute ou équivalent local reconnu).
Documents : lettre/certificat du DC, description de la redondance (alimentation N+1/2N, refroidissement, réseau).
SLA 99,99% avec un NOC 24/7.
Conformité aux normes de sécurité incendie ; disponibilité des procédures d'urgence (RPO/RTO).
Entités légales uniquement. Les « salles serveurs » à domicile/bureau ne sont pas acceptées.
2.2 Base matérielle (minimum)
CPU : à partir de 64 threads.
RAM : à partir de 128 Go (256 Go+ recommandé pour multi-GPU/HPC).
Stockage : NVMe SSD ≥ 1 To, débit ≥ 1 Go/s (RAID1/10 recommandé pour le système et les données).
Réseau : ≥ 1 Gbps symétrique (10 Gbps préféré, redondance L2/L3, IPv4 statique ; IPv6 est un plus).
GPU (tier) : L40S / H200 et au-dessus ou équivalents résilients aux charges lourdes : B200, H100, H200, A100, L40S, RTX 4090/5090 (cartes série A pour serveurs et cartes data-center préférées).
2.3 Interconnexions haute performance (préférées)
InfiniBand (EDR/HDR/NDR) pour l'entraînement distribué/HPC.
NVLink/NVSwitch — souhaitable pour le multi-GPU au sein d'un nœud.
2.4 Fiabilité et remplacement
En cas de défaillance matérielle — un pour un remplacement (configuration identique ou strictement équivalente) sans dégradation du SLA.
Stock obligatoire de pièces de rechange / « hot » spares.
2.5 Sécurité et hygiène des données
Stérilisation des disques entre les locations : blkdiscard/secure erase/1-pass zero/TRIM (journalisation).
Isolation IPMI, gestion mgmt périmètre, ACL/profil DDoS.
Images OS — vérifiées, avec microcodes/corrections à jour, prise en charge des NVIDIA pilotes.
3) Conditions commerciales minimales
Durée minimale de location : à partir de 1 mois.
Tarification : listes de prix compétitives selon la géolocalisation (en tenant compte du trafic/électricité/TVA).
Intégration API est obligatoire/souhaitée (selon le volume) pour l'auto-provisionnement, les extensions et la supervision.
4) Exigences logicielles et d'images
OS : Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9 ; sur demande — Windows Server (avec licence).
Pile GPU : NVIDIA 550.xx+ (ou celles recommandées pour des GPUs spécifiques), CUDA 12.2/12.4+.
Gestion : SSH (obligatoire), IPMI/KVM (préféré) avec comptes temporaires pour le locataire.
Conteneurisation : Docker/Podman sur demande ; Kubernetes — autorisé si un master est provisionné dans le même DC.
5) Comment un fournisseur peut se connecter au Bare Metal
Candidature et vérification :
Entité légale, contrat officiel avec un DC Tier 3+, SLA 99,99%, NOC 24/7.
Dossier de documents : certificat Tier/équivalent, SLA, sécurité incendie, schéma de redondance.
Tests d'acceptation : IPv4 publique, capture d'écran/accès à l'IPMI (KVM), résultats iPerf3/performance disque.
Catalogue SKU et tarification :
Cartes standardisées (composition GPU, threads CPU, RAM, NVMe, réseau, IB/NVLink, DC/emplacement, limites de trafic).
Prix liés à la géographie. Durée minimale — 2 semaines.
Politiques opérationnelles :
Temps de réponse aux incidents : ≤ 15 min ; remplacement matériel : équivalent immédiatement.
Journalisation de la stérilisation des disques, fermeture de l'accès admin après restitution, audit.
Rapports mensuels sur la disponibilité/incidents.
6) Exigences réseau et de débit
Minimum 1 Gbps (symétrique), de préférence 10 Gbps avec redondance.
IPv4 publique, prise en charge du rDNS sur demande ; IPv6 est souhaitable.
ACL de base, profil anti-DDoS, mgmt-VLAN dédié pour l'IPMI.
Pour InfiniBand — segmentation L2 directe au sein du rack/salle et disponibilité OFED.
7) Exemples de charges de travail
Entraînement LLM multi-GPU : 8×L40S/NVLink ou un cluster IB de nœuds A100/H100/H200.
Rendu vidéo : 4×RTX 4090/5090 avec cache NVMe local et 10 Gbps egress.
HFT/trading : latences faibles, CPU 64–128 threads, RAM 256–512 Go, NVMe RAID1 et 10 Gbps réseau.
Génomique/HPC : A100/H100 avec IB HDR/NDR, SLURM / prise en charge MPI.
Comparaison entre location standard et Bare Metal
Ce que c'est
Conteneur/environnement à l'intérieur de l'OS hôte
Serveur physique entier
Ressources (CPU/RAM/bande passante)
Partagées par l'ordonnanceur ; quotas cgroup, étranglement possible
Exclusives ; CPU/RAM/bande passante prévisibles
Root/privileges
root à l'intérieur du conteneur, pas d'accès au BIOS
Root complet du serveur ; accès BIOS/UEFI
Pilotes GPU (CUDA/NVIDIA)
Version définie par l'hôte
Vous installez les versions requises (CUDA/OFED, etc.)
Contrôle GPU
Passthrough avec restrictions (PL/OC selon la politique de l'hôte)
Contrôle complet PL/OC ; NVLink/NVSwitch (si présent)
IPMI/KVM/Média virtuel
Non
Oui (console distante, montage ISO)
Stockage
Volumes/points de montage de l'hôte ; la bande passante peut fluctuer
NVMe/RAID direct ; IOPS/débit stables
Réseau
Ports/NAT/bande passante partagée
NIC dédiée 1–10G+ ; rDNS, VLAN ; IPv4 publique
Fiabilité / SLA
Dépend de l'hôte ; pas d'échange garanti identique
DC Tier 3+, SLA cible 99,99%, remplacement identique obligatoire
Durée minimale
Généralement heures/jours
À partir de 2 semaines
Coût
Plus faible
Plus élevé (exclusif + centre de données)
Temps de démarrage
Secondes–minutes
de 1h jusqu'à 48h pour démarrer
HPC / InfiniBand
Généralement non
Recommandé (InfiniBand), NVLink/NVSwitch
Idéal pour
Tâches rapides, tests, mining, sessions courtes
IA/ML/HPC, charges de production, projets longs
Exigences pour le fournisseur
De base
Entité légale, DC Tier 3+, NOC 24/7, tarification régionale, API
Sécurité / données
Selon les politiques de l'hôte
Assainissement des disques entre locations, gestion isolée (IPMI)
FAQ
En quoi le Bare Metal est-il différent de la location de conteneurs ? Le Bare Metal est entièrement votre machine physique (CPU/RAM/Disque/Net/GPU). Dans la location de conteneurs, les ressources sont partagées et vous travaillez dans un environnement isolé.
L'IPMI est-il requis ? Préféré. Il accélère la réinstallation de l'OS et fournit l'accès KVM, surtout pour les problèmes réseau/SSH.
Les nœuds peuvent-ils être interconnectés via IB ? Oui, InfiniBand est encouragé pour l'entraînement distribué/HPC. Spécifiez la bande passante/type IB dans le SKU.
Quel est le minimum pour les GPUs ? Niveau L40S / H200 et au-dessus, ou équivalent résilient aux charges lourdes (B200, H100, A100, etc.).
Que se passe-t-il si le serveur « tombe » ? Le fournisseur doit fournir rapidement un remplacement identique sans dégradation (SLA 99,99%).
Mis à jour
Ce contenu vous a-t-il été utile ?