Natif (Bare Metal)
Clore Bare Metal — Exigences et guide
Clore Bare Metal sont des serveurs physiques (non virtualisés) avec un accès root complet, sans partage et sans limitations d'alimentation. Conviennent pour l'IA/ML, le HPC, le rendu 3D et toutes charges de travail lourdes.
GPU disponibles (exemples): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090, etc. Emplacements (départ): États-Unis, Japon, Hong Kong, et autres SLA : Centres de données Tier 3 et plus, disponibilité cible 99.99%.
1) Qu'est-ce que le Bare Metal sur Clore
Vous obtenez une machine physique entière (CPU, RAM, disques, réseau, GPU).
Accès root/SSH complet et, lorsque disponible, IPMI/KVM pour la réinstallation du système d'exploitation.
Pas de limites PL / couches isolantes — les performances correspondent au matériel.
Diffère des locations basées sur des conteneurs (HiveOS/Docker) en ce que les ressources ne sont pas partagées.
2) Exigences d'infrastructure obligatoires (pour les fournisseurs)
2.1 Centre de données
Minimum Niveau 3 (Uptime Institute ou équivalent local reconnu).
Documents : lettre/certificat du DC, description de la redondance (alimentation N+1/2N, refroidissement, réseau).
SLA 99,99% avec un NOC 24/7.
Conformité aux normes de sécurité incendie ; disponibilité des procédures d'urgence (RPO/RTO).
Personnes morales uniquement. « Salles serveurs » à domicile/bureau non acceptées.
2.2 Base matérielle (minimum)
CPU : à partir de 64 threads.
RAM : à partir de 128 Go (256 Go+ recommandés pour multi-GPU/HPC).
Stockage : NVMe SSD ≥ 1 To, débit ≥ 1 Go/s (RAID1/10 recommandé pour le système et les données).
Réseau : ≥ 1 Gbps symétrique (10 Gbps préféré, redondance L2/L3, IPv4 statique ; IPv6 est un plus).
GPU (niveau) : L40S / H200 et supérieurs ou équivalents résilients aux charges lourdes : B200, H100, H200, A100, L40S, RTX 4090/5090 (cartes série serveur et cartes pour centres de données préférées).
2.3 Interconnexions haute performance (préférées)
InfiniBand (EDR/HDR/NDR) pour l'entraînement distribué/HPC.
NVLink/NVSwitch — souhaitable pour le multi-GPU au sein d'un nœud.
2.4 Fiabilité et remplacement
En cas de panne matérielle — remplacement un pour un (configuration identique ou strictement équivalente) sans dégradation du SLA.
Stock obligatoire de pièces de rechange / composants « hot » en réserve.
2.5 Sécurité et hygiène des données
Stérilisation des disques entre locations : blkdiscard/secure erase/écrasement 1 passage/TRIM (journalisation).
Isolation IPMI, gestion mgmt périmètre, ACL/profil DDoS.
Images OS — vérifiées, avec microcodes/correctifs à jour, prise en charge des pilotes NVIDIA .
3) Conditions commerciales minimales
Durée minimale de location : à partir de 1 mois.
Tarification : listes de prix compétitives selon la géolocalisation (en tenant compte du trafic/électricité/TVA).
Intégration API est obligatoire/souhaitée (selon le volume) pour l'auto-provisionnement, les extensions et la supervision.
4) Exigences logicielles et d'images
OS : Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9 ; sur demande — Windows Server (avec licence).
Pile GPU : NVIDIA 550.xx+ (ou celles recommandées pour des GPU spécifiques), CUDA 12.2/12.4+.
Gestion : SSH (obligatoire), IPMI/KVM (préféré) avec comptes temporaires pour le locataire.
Containerisation : Docker/Podman sur demande ; Kubernetes — autorisé si un master est provisionné dans le même DC.
5) Comment un fournisseur peut se connecter au Bare Metal
Candidature et vérification :
Personne morale, contrat officiel avec un DC Tier 3+, SLA 99,99%, NOC 24/7.
Dossier de documents : certificat Tier/équivalent, SLA, sécurité incendie, schéma de redondance.
Tests d'acceptation : IPv4 publique, capture d'écran/accès à l'IPMI (KVM), résultats iPerf3/performance disque.
Catalogue SKU et tarification :
Cartes standardisées (composition GPU, threads CPU, RAM, NVMe, réseau, IB/NVLink, DC/emplacement, limites de trafic).
Prix liés à la géographie. Durée minimale — 2 semaines.
Politiques opérationnelles :
Temps de réponse incident : ≤ 15 min ; remplacement matériel : équivalent immédiatement.
Journalisation de la stérilisation des disques, fermeture de l'accès admin après retour, audit.
Rapports mensuels sur la disponibilité/incidents.
6) Exigences réseau et de débit
Minimum 1 Gbps (symétrique), de préférence 10 Gbps avec redondance.
IPv4 publique, prise en charge de rDNS sur demande ; IPv6 est souhaitable.
ACL de base, profil anti-DDoS, mgmt-VLAN dédié pour IPMI.
Pour InfiniBand — segmentation L2 directe au sein du rack/de la salle et disponibilité OFED.
7) Exemples de charges de travail
Entraînement LLM multi-GPU : 8×L40S/NVLink ou un cluster IB de nœuds A100/H100/H200.
Rendu vidéo : 4×RTX 4090/5090 avec cache NVMe local et 10 Gbps egress.
HFT/trading : faibles latences, CPU 64–128 threads, RAM 256–512 Go, NVMe RAID1 et 10 Gbps réseau.
Génomique/HPC : A100/H100 avec IB HDR/NDR, SLURM / prise en charge MPI.
Comparaison entre location standard et Bare Metal
Ce que c'est
Conteneur/environnement à l'intérieur du système hôte
Serveur physique entier
Ressources (CPU/RAM/bande passante)
Partagées par l'ordonnanceur ; quotas cgroup, possible limitation
Exclusives ; CPU/RAM/bande passante prévisibles
Root/privileges
root à l'intérieur du conteneur, pas d'accès au BIOS
Root complet du serveur ; accès BIOS/UEFI
Pilotes GPU (CUDA/NVIDIA)
Version définie par l'hôte
Vous installez les versions requises (CUDA/OFED, etc.)
Contrôle GPU
Passthrough avec restrictions (PL/OC selon la politique de l'hôte)
Contrôle PL/OC complet ; NVLink/NVSwitch (si présent)
IPMI/KVM/Virtual Media
Non
Oui (console distante, montage ISO)
Stockage
Volumes/montages de l'hôte ; le débit peut fluctuer
NVMe/RAID direct ; IOPS/débit stables
Réseau
Ports/NAT/bande passante partagée
NIC dédiée 1–10G+ ; rDNS, VLAN ; IPv4 publique
Fiabilité / SLA
Dépend de l'hôte ; pas d'échange garanti identique
DC Tier 3+, SLA cible 99,99%, remplacement obligatoire identique
Durée minimale
Généralement heures/jours
À partir de 2 semaines
Coût
Plus bas
Plus élevé (exclusif + centre de données)
Temps de démarrage
Secondes–minutes
de 1h jusqu'à 48h pour démarrer
HPC / InfiniBand
Généralement non
Recommandé (InfiniBand), NVLink/NVSwitch
Idéal pour
Tâches rapides, tests, minage, sessions courtes
IA/ML/HPC, charges en production, projets longs
Exigences pour le fournisseur
De base
Personne morale, DC Tier 3+, NOC 24/7, tarification régionale, API
Sécurité / données
Selon les politiques de l'hôte
Assainissement des disques entre locations, gestion isolée (IPMI)
FAQ
En quoi le Bare Metal diffère-t-il de la location de conteneurs ? Bare Metal est entièrement votre machine physique (CPU/RAM/Disque/Réseau/GPU). Dans la location de conteneurs, les ressources sont partagées et vous travaillez dans un environnement isolé.
L'IPMI est-il requis ? Préféré. Il accélère la réinstallation du système d'exploitation et fournit l'accès KVM, notamment pour les problèmes réseau/SSH.
Les nœuds peuvent-ils être interconnectés via IB ? Oui, InfiniBand est encouragé pour l'entraînement distribué/HPC. Spécifiez la bande passante/type IB dans le SKU.
Quel est le minimum pour les GPU ? Niveau L40S / H200 et supérieurs, ou un équivalent résilient aux charges lourdes (B200, H100, A100, etc.).
Que se passe-t-il si le serveur « tombe » ? Le fournisseur doit fournir rapidement un remplacement identique sans dégradation (SLA 99,99%).
Mis à jour
Ce contenu vous a-t-il été utile ?