Bare metal

Clore Bare Metal — Exigences et guide

Clore Bare Metal sont des serveurs physiques (non virtualisés) avec accès root complet, sans partage et sans limites d'alimentation. Convient pour l'IA/ML, le HPC, le rendu 3D et toute charge de travail lourde.

GPUs disponibles (exemples) : B200, H100, H200, A100, L40S, RTX 5090, RTX 4090, etc. Localisations (départ) : États-Unis, Japon, Hong Kong et autres SLA : Centres de données de niveau Tier 3 et plus, disponibilité cible 99.99%.


1) Qu'est-ce que le Bare Metal chez Clore

  • Vous obtenez une machine physique entière (CPU, RAM, disques, réseau, GPU).

  • Accès root/SSH complet et, lorsque disponible, IPMI/KVM pour la réinstallation du système d'exploitation.

  • Pas de limites PL / couches d'isolation — les performances correspondent au matériel.

  • Diffère des locations basées sur des conteneurs (HiveOS/Docker) en ce que les ressources ne sont pas partagées.


2) Exigences d'infrastructure obligatoires (pour les fournisseurs)

2.1 Centre de données

  • Minimum Tier 3 (Uptime Institute ou équivalent local reconnu).

  • Documents : lettre/certificat du DC, description de la redondance (alimentation N+1/2N, refroidissement, réseau).

  • SLA 99,99% avec un NOC 24/7.

  • Conformité aux normes de sécurité incendie ; disponibilité des procédures d'urgence (RPO/RTO).

  • Entités légales uniquement. Les « salles serveurs » à domicile/bureau ne sont pas acceptées.

2.2 Base matérielle (minimum)

  • CPU : à partir de 64 threads.

  • RAM : à partir de 128 Go (256 Go+ recommandé pour multi-GPU/HPC).

  • Stockage : NVMe SSD ≥ 1 To, débit ≥ 1 Go/s (RAID1/10 recommandé pour le système et les données).

  • Réseau : ≥ 1 Gbps symétrique (10 Gbps préféré, redondance L2/L3, IPv4 statique ; IPv6 est un plus).

  • GPU (tier) : L40S / H200 et au-dessus ou équivalents résilients aux charges lourdes : B200, H100, H200, A100, L40S, RTX 4090/5090 (cartes série A pour serveurs et cartes data-center préférées).

2.3 Interconnexions haute performance (préférées)

  • InfiniBand (EDR/HDR/NDR) pour l'entraînement distribué/HPC.

  • NVLink/NVSwitch — souhaitable pour le multi-GPU au sein d'un nœud.

2.4 Fiabilité et remplacement

  • En cas de défaillance matérielle — un pour un remplacement (configuration identique ou strictement équivalente) sans dégradation du SLA.

  • Stock obligatoire de pièces de rechange / « hot » spares.

2.5 Sécurité et hygiène des données

  • Stérilisation des disques entre les locations : blkdiscard/secure erase/1-pass zero/TRIM (journalisation).

  • Isolation IPMI, gestion mgmt périmètre, ACL/profil DDoS.

  • Images OS — vérifiées, avec microcodes/corrections à jour, prise en charge des NVIDIA pilotes.


3) Conditions commerciales minimales

  • Durée minimale de location : à partir de 1 mois.

  • Tarification : listes de prix compétitives selon la géolocalisation (en tenant compte du trafic/électricité/TVA).

  • Intégration API est obligatoire/souhaitée (selon le volume) pour l'auto-provisionnement, les extensions et la supervision.


4) Exigences logicielles et d'images

  • OS : Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9 ; sur demande — Windows Server (avec licence).

  • Pile GPU : NVIDIA 550.xx+ (ou celles recommandées pour des GPUs spécifiques), CUDA 12.2/12.4+.

  • Gestion : SSH (obligatoire), IPMI/KVM (préféré) avec comptes temporaires pour le locataire.

  • Conteneurisation : Docker/Podman sur demande ; Kubernetes — autorisé si un master est provisionné dans le même DC.


5) Comment un fournisseur peut se connecter au Bare Metal

  1. Candidature et vérification :

    • Entité légale, contrat officiel avec un DC Tier 3+, SLA 99,99%, NOC 24/7.

    • Dossier de documents : certificat Tier/équivalent, SLA, sécurité incendie, schéma de redondance.

    • Tests d'acceptation : IPv4 publique, capture d'écran/accès à l'IPMI (KVM), résultats iPerf3/performance disque.

  2. Catalogue SKU et tarification :

    • Cartes standardisées (composition GPU, threads CPU, RAM, NVMe, réseau, IB/NVLink, DC/emplacement, limites de trafic).

    • Prix liés à la géographie. Durée minimale — 2 semaines.

  3. Politiques opérationnelles :

    • Temps de réponse aux incidents : ≤ 15 min ; remplacement matériel : équivalent immédiatement.

    • Journalisation de la stérilisation des disques, fermeture de l'accès admin après restitution, audit.

    • Rapports mensuels sur la disponibilité/incidents.

6) Exigences réseau et de débit

  • Minimum 1 Gbps (symétrique), de préférence 10 Gbps avec redondance.

  • IPv4 publique, prise en charge du rDNS sur demande ; IPv6 est souhaitable.

  • ACL de base, profil anti-DDoS, mgmt-VLAN dédié pour l'IPMI.

  • Pour InfiniBand — segmentation L2 directe au sein du rack/salle et disponibilité OFED.


7) Exemples de charges de travail

  • Entraînement LLM multi-GPU : 8×L40S/NVLink ou un cluster IB de nœuds A100/H100/H200.

  • Rendu vidéo : 4×RTX 4090/5090 avec cache NVMe local et 10 Gbps egress.

  • HFT/trading : latences faibles, CPU 64–128 threads, RAM 256–512 Go, NVMe RAID1 et 10 Gbps réseau.

  • Génomique/HPC : A100/H100 avec IB HDR/NDR, SLURM / prise en charge MPI.


Comparaison entre location standard et Bare Metal

Paramètre
Location standard (HiveOS/Docker)
Bare Metal

Ce que c'est

Conteneur/environnement à l'intérieur de l'OS hôte

Serveur physique entier

Ressources (CPU/RAM/bande passante)

Partagées par l'ordonnanceur ; quotas cgroup, étranglement possible

Exclusives ; CPU/RAM/bande passante prévisibles

Root/privileges

root à l'intérieur du conteneur, pas d'accès au BIOS

Root complet du serveur ; accès BIOS/UEFI

Pilotes GPU (CUDA/NVIDIA)

Version définie par l'hôte

Vous installez les versions requises (CUDA/OFED, etc.)

Contrôle GPU

Passthrough avec restrictions (PL/OC selon la politique de l'hôte)

Contrôle complet PL/OC ; NVLink/NVSwitch (si présent)

IPMI/KVM/Média virtuel

Non

Oui (console distante, montage ISO)

Stockage

Volumes/points de montage de l'hôte ; la bande passante peut fluctuer

NVMe/RAID direct ; IOPS/débit stables

Réseau

Ports/NAT/bande passante partagée

NIC dédiée 1–10G+ ; rDNS, VLAN ; IPv4 publique

Fiabilité / SLA

Dépend de l'hôte ; pas d'échange garanti identique

DC Tier 3+, SLA cible 99,99%, remplacement identique obligatoire

Durée minimale

Généralement heures/jours

À partir de 2 semaines

Coût

Plus faible

Plus élevé (exclusif + centre de données)

Temps de démarrage

Secondes–minutes

de 1h jusqu'à 48h pour démarrer

HPC / InfiniBand

Généralement non

Recommandé (InfiniBand), NVLink/NVSwitch

Idéal pour

Tâches rapides, tests, mining, sessions courtes

IA/ML/HPC, charges de production, projets longs

Exigences pour le fournisseur

De base

Entité légale, DC Tier 3+, NOC 24/7, tarification régionale, API

Sécurité / données

Selon les politiques de l'hôte

Assainissement des disques entre locations, gestion isolée (IPMI)

FAQ

En quoi le Bare Metal est-il différent de la location de conteneurs ? Le Bare Metal est entièrement votre machine physique (CPU/RAM/Disque/Net/GPU). Dans la location de conteneurs, les ressources sont partagées et vous travaillez dans un environnement isolé.

L'IPMI est-il requis ? Préféré. Il accélère la réinstallation de l'OS et fournit l'accès KVM, surtout pour les problèmes réseau/SSH.

Les nœuds peuvent-ils être interconnectés via IB ? Oui, InfiniBand est encouragé pour l'entraînement distribué/HPC. Spécifiez la bande passante/type IB dans le SKU.

Quel est le minimum pour les GPUs ? Niveau L40S / H200 et au-dessus, ou équivalent résilient aux charges lourdes (B200, H100, A100, etc.).

Que se passe-t-il si le serveur « tombe » ? Le fournisseur doit fournir rapidement un remplacement identique sans dégradation (SLA 99,99%).

Mis à jour

Ce contenu vous a-t-il été utile ?