Fortgeschritten
Clore Bare Metal — Anforderungen und Anleitung
Clore Bare Metal sind physische (nicht virtualisierte) Server mit vollem Root-Zugriff, keiner Teilung und keinen Leistungsgrenzen. Geeignet für AI/ML, HPC, 3D-Rendering und alle rechenintensiven Workloads.
Verfügbare GPUs (Beispiele): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090 usw. Standorte (Start): USA, Japan, Hongkong und andere SLA: Tier-3- und höher-Rechenzentren, Zielverfügbarkeit 99.99%.
1) Was ist Bare Metal bei Clore
Sie erhalten eine ganze physische Maschine (CPU, RAM, Festplatten, Netzwerk, GPU).
Voller Root-Zugriff/SSH und, sofern verfügbar, IPMI/KVM für Neuinstallation des Betriebssystems.
Keine PL-Grenzen / Isolationsschichten — Leistung entspricht der Hardware.
Unterscheidet sich von containerbasierten Vermietungen (HiveOS/Docker) dadurch, dass Ressourcen nicht geteilt werden.
2) Obligatorische Infrastrukturanforderungen (für Anbieter)
2.1 Rechenzentrum
Mindestbetrag Stufe 3 (Uptime Institute oder ein anerkanntes lokales Äquivalent).
Dokumente: DC-Schreiben/-Zertifikat, Beschreibung der Redundanz (Strom N+1/2N, Kühlung, Netzwerk).
SLA 99,99% mit 24/7 NOC.
Einhaltung von Brandschutzstandards; Verfügbarkeit von Notfallverfahren (RPO/RTO).
Nur juristische Personen. Heim-/Büro-„Serverräume“ werden nicht akzeptiert.
2.2 Hardware-Basis (Mindestanforderung)
CPU: ab 64 Threads.
RAM: ab 128 GB (256 GB+ empfohlen für Multi-GPU/HPC).
Speicher: NVMe-SSD ≥ 1 TB, Durchsatz ≥ 1 GB/s (RAID1/10 für System und Daten empfohlen).
Netzwerk: ≥ 1 Gbps symmetrisch (10 Gbps bevorzugt, L2/L3-Redundanz, statisches IPv4; IPv6 ist ein Plus).
GPU (Tier): L40S / H200 und höher oder äquivalente Karten, die für schwere Workloads resilient sind: B200, H100, H200, A100, L40S, RTX 4090/5090 (Server A-Serie und Datacenter-Karten bevorzugt).
2.3 Hochleistungs-Interconnects (bevorzugt)
InfiniBand (EDR/HDR/NDR) für verteiltes Training/HPC.
NVLink/NVSwitch — wünschenswert für Multi-GPU innerhalb eines Nodes.
2.4 Zuverlässigkeit und Ersatz
Im Falle eines Hardwareausfalls — Eins-zu-eins Austausch (identische oder strikt gleichwertige Konfiguration) ohne SLA-Verschlechterung.
Verpflichtender Vorrat an Ersatzteilen / „Hot“-Spares.
2.5 Sicherheit und Datenhygiene
Festplatten-Sterilisation zwischen Vermietungen: blkdiscard/secure erase/1-pass zero/TRIM (Protokollierung).
IPMI-Isolierung, geschlossen mgmt Perimeter, ACL/DDoS-Profil.
OS-Images — geprüft, mit aktuellen Microcodes/Patches, Unterstützung für NVIDIA Treiber.
3) Minimale kommerzielle Bedingungen
Mindestmietdauer: ab 1 Monat.
Preisgestaltung: preislisten wettbewerbsfähig nach Geostandort (unter Berücksichtigung von Traffic-/Strom-/MwSt.-Kosten).
API-Integration ist obligatorisch/gewünscht (abhängig vom Volumen) für Auto-Provisioning, Verlängerungen und Monitoring.
4) Software- und Image-Anforderungen
OS: Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9; auf Anfrage — Windows Server (mit Lizenzierung).
GPU-Stack: NVIDIA 550.xx+ (oder jene, die für spezifische GPUs empfohlen werden), CUDA 12.2/12.4+.
Management: SSH (erforderlich), IPMI/KVM (bevorzugt) mit temporären Accounts für den Mieter.
Containerisierung: Docker/Podman auf Anfrage; Kubernetes — erlaubt, wenn ein Master im selben Rechenzentrum bereitgestellt wird.
5) Wie ein Anbieter sich mit Bare Metal verbinden kann
Bewerbung & Verifizierung:
Juristische Person, offizieller Vertrag mit einem Tier-3+-Rechenzentrum, SLA 99,99%, 24/7 NOC.
Dokumentenpaket: Tier-/äquivalentes Zertifikat, SLA, Brandschutz, Redundanzschema.
Abnahmetests: öffentliche IPv4, Screenshot/Zugriff auf IPMI (KVM), iPerf3/Plattenleistungs-Ergebnisse.
SKU-Katalog & Preisgestaltung:
Standardisierte Karten (GPU-Zusammenstellung, CPU-Threads, RAM, NVMe, Netzwerk, IB/NVLink, DC/Standort, Traffic-Limits).
Preise nach Geografie. Mindestlaufzeit — 2 Wochen.
Betriebliche Richtlinien:
Reaktionszeit bei Vorfällen: ≤ 15 Min.; Hardwareaustausch: sofort gleichwertig.
Protokollierung der Festplatten-Sterilisation, Schließung des Admin-Zugangs nach Rückgabe, Audit.
Monatliche Berichte über Verfügbarkeit/Vorfälle.
6) Netzwerk- und Durchsatzanforderungen
Mindestbetrag 1 Gbps (symmetrisch), vorzugsweise 10 Gbps mit Redundanz.
Öffentliche IPv4, rDNS-Unterstützung auf Anfrage; IPv6 ist wünschenswert.
Basis-ACLs, Anti-DDoS-Profil, dedizierte mgmt-VLAN für IPMI.
Für InfiniBand — direkte L2-Segmentierung innerhalb des Racks/Raums und OFED-Verfügbarkeit.
7) Beispiel-Workloads
Multi-GPU LLM-Training: 8×L40S/NVLink oder ein IB-Cluster aus A100/H100/H200-Nodes.
Video-Rendering: 4×RTX 4090/5090 mit lokalem NVMe-Cache und 10 Gbps Egress.
HFT/Trading: niedrige Latenzen, CPU 64–128 Threads, RAM 256–512 GB, NVMe RAID1 und 10 Gbps Netzwerk.
Genomik/HPC: A100/H100 mit IB HDR/NDR, SLURM / MPI-Unterstützung.
Vergleich zwischen Standardvermietung und Bare Metal
Was es ist
Container/Umgebung innerhalb des Host-OS
Ganze physische Server
Ressourcen (CPU/RAM/Bandbreite)
Vom Scheduler geteilt; cgroup-Quotas, mögliche Drosselung
Exklusiv; vorhersehbare CPU/RAM/Bandbreite
Root/Privilegien
root innerhalb des Containers, kein BIOS-Zugriff
Voller Server-Root; BIOS/UEFI-Zugriff
GPU-Treiber (CUDA/NVIDIA)
Version vom Host festgelegt
Sie installieren die benötigten Versionen (CUDA/OFED usw.)
GPU-Steuerung
Passthrough mit Einschränkungen (PL/OC gemäß Host-Policy)
Volle PL/OC-Kontrolle; NVLink/NVSwitch (falls vorhanden)
IPMI/KVM/Virtual Media
Nein
Ja (Fernkonsole, ISO-Einbindung)
Speicher
Host-Volumes/Mounts; Bandbreite kann schwanken
Direktes NVMe/RAID; stabile IOPS/Durchsatz
Netzwerk
Ports/NAT/geteilte Bandbreite
Dedizierte NIC 1–10G+; rDNS, VLAN; öffentliche IPv4
Zuverlässigkeit / SLA
Abhängig vom Host; kein garantierter gleichwertiger Austausch
DC Tier 3+, Ziel-SLA 99,99%, verpflichtender gleichwertiger Ersatz
Mindestlaufzeit
Üblicherweise Stunden/Tage
Ab 2 Wochen
Kosten
Niedriger
Höher (exklusiv + Rechenzentrum)
Zeit bis zum Start
Sekunden–Minuten
von 1 Std. bis zu 48 Std. bis zum Start
HPC / InfiniBand
Üblicherweise nein
Empfohlen (InfiniBand), NVLink/NVSwitch
Am besten für
Schnelle Aufgaben, Tests, Mining, kurze Sessions
AI/ML/HPC, Produktions-Workloads, lange Projekte
Anforderungen an den Anbieter
Grundlegend
Juristische Person, DC Tier 3+, 24/7 NOC, regionale Preisgestaltung, API
Sicherheit / Daten
Innerhalb der Host-Policies
Festplatten-Säuberung zwischen Vermietungen, isoliertes mgmt (IPMI)
FAQ
Worin unterscheidet sich Bare Metal von Containervermietung? Bare Metal ist vollständig Ihre physische Maschine (CPU/RAM/Festplatte/Netz/GPU). Bei Containervermietung werden Ressourcen geteilt und Sie arbeiten in einer isolierten Umgebung.
Ist IPMI erforderlich? Bevorzugt. Es beschleunigt die Neuinstallation des OS und bietet KVM-Zugriff, besonders bei Netzwerk-/SSH-Problemen.
Können Nodes über IB verbunden werden? Ja, InfiniBand wird für verteiltes Training/HPC empfohlen. Geben Sie die IB-Bandbreite/den Typ im SKU an.
Was ist das Minimum für GPUs? L40S / H200-Level und höher, oder ein Äquivalent, das gegenüber schweren Workloads resilient ist (B200, H100, A100 usw.).
Was, wenn der Server „ausfällt“? Der Anbieter muss umgehend einen identischen Ersatz liefern ohne Verschlechterung (SLA 99,99%).
Zuletzt aktualisiert
War das hilfreich?