Fortgeschritten

Clore Bare Metal — Anforderungen und Anleitung

Clore Bare Metal sind physische (nicht virtualisierte) Server mit vollem Root-Zugriff, keiner Teilung und keinen Leistungsgrenzen. Geeignet für AI/ML, HPC, 3D-Rendering und alle rechenintensiven Workloads.

Verfügbare GPUs (Beispiele): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090 usw. Standorte (Start): USA, Japan, Hongkong und andere SLA: Tier-3- und höher-Rechenzentren, Zielverfügbarkeit 99.99%.


1) Was ist Bare Metal bei Clore

  • Sie erhalten eine ganze physische Maschine (CPU, RAM, Festplatten, Netzwerk, GPU).

  • Voller Root-Zugriff/SSH und, sofern verfügbar, IPMI/KVM für Neuinstallation des Betriebssystems.

  • Keine PL-Grenzen / Isolationsschichten — Leistung entspricht der Hardware.

  • Unterscheidet sich von containerbasierten Vermietungen (HiveOS/Docker) dadurch, dass Ressourcen nicht geteilt werden.


2) Obligatorische Infrastrukturanforderungen (für Anbieter)

2.1 Rechenzentrum

  • Mindestbetrag Stufe 3 (Uptime Institute oder ein anerkanntes lokales Äquivalent).

  • Dokumente: DC-Schreiben/-Zertifikat, Beschreibung der Redundanz (Strom N+1/2N, Kühlung, Netzwerk).

  • SLA 99,99% mit 24/7 NOC.

  • Einhaltung von Brandschutzstandards; Verfügbarkeit von Notfallverfahren (RPO/RTO).

  • Nur juristische Personen. Heim-/Büro-„Serverräume“ werden nicht akzeptiert.

2.2 Hardware-Basis (Mindestanforderung)

  • CPU: ab 64 Threads.

  • RAM: ab 128 GB (256 GB+ empfohlen für Multi-GPU/HPC).

  • Speicher: NVMe-SSD ≥ 1 TB, Durchsatz ≥ 1 GB/s (RAID1/10 für System und Daten empfohlen).

  • Netzwerk: ≥ 1 Gbps symmetrisch (10 Gbps bevorzugt, L2/L3-Redundanz, statisches IPv4; IPv6 ist ein Plus).

  • GPU (Tier): L40S / H200 und höher oder äquivalente Karten, die für schwere Workloads resilient sind: B200, H100, H200, A100, L40S, RTX 4090/5090 (Server A-Serie und Datacenter-Karten bevorzugt).

2.3 Hochleistungs-Interconnects (bevorzugt)

  • InfiniBand (EDR/HDR/NDR) für verteiltes Training/HPC.

  • NVLink/NVSwitch — wünschenswert für Multi-GPU innerhalb eines Nodes.

2.4 Zuverlässigkeit und Ersatz

  • Im Falle eines Hardwareausfalls — Eins-zu-eins Austausch (identische oder strikt gleichwertige Konfiguration) ohne SLA-Verschlechterung.

  • Verpflichtender Vorrat an Ersatzteilen / „Hot“-Spares.

2.5 Sicherheit und Datenhygiene

  • Festplatten-Sterilisation zwischen Vermietungen: blkdiscard/secure erase/1-pass zero/TRIM (Protokollierung).

  • IPMI-Isolierung, geschlossen mgmt Perimeter, ACL/DDoS-Profil.

  • OS-Images — geprüft, mit aktuellen Microcodes/Patches, Unterstützung für NVIDIA Treiber.


3) Minimale kommerzielle Bedingungen

  • Mindestmietdauer: ab 1 Monat.

  • Preisgestaltung: preislisten wettbewerbsfähig nach Geostandort (unter Berücksichtigung von Traffic-/Strom-/MwSt.-Kosten).

  • API-Integration ist obligatorisch/gewünscht (abhängig vom Volumen) für Auto-Provisioning, Verlängerungen und Monitoring.


4) Software- und Image-Anforderungen

  • OS: Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9; auf Anfrage — Windows Server (mit Lizenzierung).

  • GPU-Stack: NVIDIA 550.xx+ (oder jene, die für spezifische GPUs empfohlen werden), CUDA 12.2/12.4+.

  • Management: SSH (erforderlich), IPMI/KVM (bevorzugt) mit temporären Accounts für den Mieter.

  • Containerisierung: Docker/Podman auf Anfrage; Kubernetes — erlaubt, wenn ein Master im selben Rechenzentrum bereitgestellt wird.


5) Wie ein Anbieter sich mit Bare Metal verbinden kann

  1. Bewerbung & Verifizierung:

    • Juristische Person, offizieller Vertrag mit einem Tier-3+-Rechenzentrum, SLA 99,99%, 24/7 NOC.

    • Dokumentenpaket: Tier-/äquivalentes Zertifikat, SLA, Brandschutz, Redundanzschema.

    • Abnahmetests: öffentliche IPv4, Screenshot/Zugriff auf IPMI (KVM), iPerf3/Plattenleistungs-Ergebnisse.

  2. SKU-Katalog & Preisgestaltung:

    • Standardisierte Karten (GPU-Zusammenstellung, CPU-Threads, RAM, NVMe, Netzwerk, IB/NVLink, DC/Standort, Traffic-Limits).

    • Preise nach Geografie. Mindestlaufzeit — 2 Wochen.

  3. Betriebliche Richtlinien:

    • Reaktionszeit bei Vorfällen: ≤ 15 Min.; Hardwareaustausch: sofort gleichwertig.

    • Protokollierung der Festplatten-Sterilisation, Schließung des Admin-Zugangs nach Rückgabe, Audit.

    • Monatliche Berichte über Verfügbarkeit/Vorfälle.

6) Netzwerk- und Durchsatzanforderungen

  • Mindestbetrag 1 Gbps (symmetrisch), vorzugsweise 10 Gbps mit Redundanz.

  • Öffentliche IPv4, rDNS-Unterstützung auf Anfrage; IPv6 ist wünschenswert.

  • Basis-ACLs, Anti-DDoS-Profil, dedizierte mgmt-VLAN für IPMI.

  • Für InfiniBand — direkte L2-Segmentierung innerhalb des Racks/Raums und OFED-Verfügbarkeit.


7) Beispiel-Workloads

  • Multi-GPU LLM-Training: 8×L40S/NVLink oder ein IB-Cluster aus A100/H100/H200-Nodes.

  • Video-Rendering: 4×RTX 4090/5090 mit lokalem NVMe-Cache und 10 Gbps Egress.

  • HFT/Trading: niedrige Latenzen, CPU 64–128 Threads, RAM 256–512 GB, NVMe RAID1 und 10 Gbps Netzwerk.

  • Genomik/HPC: A100/H100 mit IB HDR/NDR, SLURM / MPI-Unterstützung.


Vergleich zwischen Standardvermietung und Bare Metal

Parameter
Standardvermietung (HiveOS/Docker)
Bare Metal

Was es ist

Container/Umgebung innerhalb des Host-OS

Ganze physische Server

Ressourcen (CPU/RAM/Bandbreite)

Vom Scheduler geteilt; cgroup-Quotas, mögliche Drosselung

Exklusiv; vorhersehbare CPU/RAM/Bandbreite

Root/Privilegien

root innerhalb des Containers, kein BIOS-Zugriff

Voller Server-Root; BIOS/UEFI-Zugriff

GPU-Treiber (CUDA/NVIDIA)

Version vom Host festgelegt

Sie installieren die benötigten Versionen (CUDA/OFED usw.)

GPU-Steuerung

Passthrough mit Einschränkungen (PL/OC gemäß Host-Policy)

Volle PL/OC-Kontrolle; NVLink/NVSwitch (falls vorhanden)

IPMI/KVM/Virtual Media

Nein

Ja (Fernkonsole, ISO-Einbindung)

Speicher

Host-Volumes/Mounts; Bandbreite kann schwanken

Direktes NVMe/RAID; stabile IOPS/Durchsatz

Netzwerk

Ports/NAT/geteilte Bandbreite

Dedizierte NIC 1–10G+; rDNS, VLAN; öffentliche IPv4

Zuverlässigkeit / SLA

Abhängig vom Host; kein garantierter gleichwertiger Austausch

DC Tier 3+, Ziel-SLA 99,99%, verpflichtender gleichwertiger Ersatz

Mindestlaufzeit

Üblicherweise Stunden/Tage

Ab 2 Wochen

Kosten

Niedriger

Höher (exklusiv + Rechenzentrum)

Zeit bis zum Start

Sekunden–Minuten

von 1 Std. bis zu 48 Std. bis zum Start

HPC / InfiniBand

Üblicherweise nein

Empfohlen (InfiniBand), NVLink/NVSwitch

Am besten für

Schnelle Aufgaben, Tests, Mining, kurze Sessions

AI/ML/HPC, Produktions-Workloads, lange Projekte

Anforderungen an den Anbieter

Grundlegend

Juristische Person, DC Tier 3+, 24/7 NOC, regionale Preisgestaltung, API

Sicherheit / Daten

Innerhalb der Host-Policies

Festplatten-Säuberung zwischen Vermietungen, isoliertes mgmt (IPMI)

FAQ

Worin unterscheidet sich Bare Metal von Containervermietung? Bare Metal ist vollständig Ihre physische Maschine (CPU/RAM/Festplatte/Netz/GPU). Bei Containervermietung werden Ressourcen geteilt und Sie arbeiten in einer isolierten Umgebung.

Ist IPMI erforderlich? Bevorzugt. Es beschleunigt die Neuinstallation des OS und bietet KVM-Zugriff, besonders bei Netzwerk-/SSH-Problemen.

Können Nodes über IB verbunden werden? Ja, InfiniBand wird für verteiltes Training/HPC empfohlen. Geben Sie die IB-Bandbreite/den Typ im SKU an.

Was ist das Minimum für GPUs? L40S / H200-Level und höher, oder ein Äquivalent, das gegenüber schweren Workloads resilient ist (B200, H100, A100 usw.).

Was, wenn der Server „ausfällt“? Der Anbieter muss umgehend einen identischen Ersatz liefern ohne Verschlechterung (SLA 99,99%).

Zuletzt aktualisiert

War das hilfreich?