# Bare Metal

## Clore Bare Metal — Anforderungen und Anleitung

**Clore Bare Metal** sind physische (nicht virtualisierte) Server mit vollem Root-Zugriff, keiner Teilung und keinen Leistungsgrenzen. Geeignet für AI/ML, HPC, 3D-Rendering und alle rechenintensiven Workloads.

**Verfügbare GPUs (Beispiele):** B200, H100, H200, A100, L40S, RTX 5090, RTX 4090 usw.\
**Standorte (Start):** USA, Japan, Hongkong und andere\
**SLA:** Tier-3- und höher-Rechenzentren, Zielverfügbarkeit **99.99%**.

***

### 1) Was ist Bare Metal bei Clore

* Sie erhalten eine ganze physische Maschine (CPU, RAM, Festplatten, Netzwerk, GPU).
* Voller Root-Zugriff/SSH und, sofern verfügbar, IPMI/KVM für Neuinstallation des Betriebssystems.
* Keine PL-Grenzen / Isolationsschichten — Leistung entspricht der Hardware.
* Unterscheidet sich von containerbasierten Vermietungen (HiveOS/Docker) dadurch, dass Ressourcen nicht geteilt werden.

***

### 2) Obligatorische Infrastrukturanforderungen (für Anbieter)

**2.1 Rechenzentrum**

* Mindestbetrag **Stufe 3** (Uptime Institute oder ein anerkanntes lokales Äquivalent).
* Dokumente: DC-Schreiben/-Zertifikat, Beschreibung der Redundanz (Strom N+1/2N, Kühlung, Netzwerk).
* **SLA 99,99%** mit 24/7 NOC.
* Einhaltung von Brandschutzstandards; Verfügbarkeit von Notfallverfahren (RPO/RTO).
* **Nur juristische Personen.** Heim-/Büro-„Serverräume“ werden nicht akzeptiert.

**2.2 Hardware-Basis (Mindestanforderung)**

* **CPU:** ab 64 Threads.
* **RAM:** ab 128 GB (256 GB+ empfohlen für Multi-GPU/HPC).
* **Speicher:** NVMe-SSD ≥ 1 TB, Durchsatz ≥ 1 GB/s (RAID1/10 für System und Daten empfohlen).
* **Netzwerk:** ≥ 1 Gbps symmetrisch (10 Gbps bevorzugt, L2/L3-Redundanz, statisches IPv4; IPv6 ist ein Plus).
* **GPU (Tier):** L40S / H200 und höher oder äquivalente Karten, die für schwere Workloads resilient sind:\
  B200, H100, H200, A100, L40S, RTX 4090/5090 (**Server A-Serie und Datacenter-Karten bevorzugt**).

**2.3 Hochleistungs-Interconnects (bevorzugt)**

* **InfiniBand** (EDR/HDR/NDR) für verteiltes Training/HPC.
* **NVLink/NVSwitch** — wünschenswert für Multi-GPU innerhalb eines Nodes.

#### 2.4 Zuverlässigkeit und Ersatz

* Im Falle eines Hardwareausfalls — **Eins-zu-eins** Austausch (identische oder strikt gleichwertige Konfiguration) ohne SLA-Verschlechterung.
* Verpflichtender Vorrat an Ersatzteilen / „Hot“-Spares.

#### 2.5 Sicherheit und Datenhygiene

* Festplatten-Sterilisation zwischen Vermietungen: **blkdiscard/secure erase/1-pass zero/TRIM** (Protokollierung).
* IPMI-Isolierung, geschlossen **mgmt** Perimeter, ACL/DDoS-Profil.
* OS-Images — geprüft, mit aktuellen Microcodes/Patches, Unterstützung für **NVIDIA** Treiber.

***

### 3) Minimale kommerzielle Bedingungen

* **Mindestmietdauer:** ab **1 Monat**.
* **Preisgestaltung:** preislisten wettbewerbsfähig nach Geostandort (unter Berücksichtigung von Traffic-/Strom-/MwSt.-Kosten).
* **API-Integration** ist obligatorisch/gewünscht (abhängig vom Volumen) für Auto-Provisioning, Verlängerungen und Monitoring.

***

### 4) Software- und Image-Anforderungen

* **OS:** Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9; auf Anfrage — Windows Server (mit Lizenzierung).
* **GPU-Stack:** NVIDIA 550.xx+ (oder jene, die für spezifische GPUs empfohlen werden), CUDA 12.2/12.4+.
* **Management:** SSH (erforderlich), IPMI/KVM (bevorzugt) mit temporären Accounts für den Mieter.
* **Containerisierung:** Docker/Podman auf Anfrage; Kubernetes — erlaubt, wenn ein Master im selben Rechenzentrum bereitgestellt wird.

***

### 5) Wie ein Anbieter sich mit Bare Metal verbinden kann

1. **Bewerbung & Verifizierung:**
   * Juristische Person, offizieller Vertrag mit einem Tier-3+-Rechenzentrum, SLA 99,99%, 24/7 NOC.
   * Dokumentenpaket: Tier-/äquivalentes Zertifikat, SLA, Brandschutz, Redundanzschema.
   * Abnahmetests: öffentliche IPv4, Screenshot/Zugriff auf IPMI (KVM), iPerf3/Plattenleistungs-Ergebnisse.
2. **SKU-Katalog & Preisgestaltung:**
   * Standardisierte Karten (GPU-Zusammenstellung, CPU-Threads, RAM, NVMe, Netzwerk, IB/NVLink, DC/Standort, Traffic-Limits).
   * Preise nach Geografie. Mindestlaufzeit — 2 Wochen.
3. **Betriebliche Richtlinien:**
   * Reaktionszeit bei Vorfällen: ≤ 15 Min.; Hardwareaustausch: sofort gleichwertig.
   * Protokollierung der Festplatten-Sterilisation, Schließung des Admin-Zugangs nach Rückgabe, Audit.
   * Monatliche Berichte über Verfügbarkeit/Vorfälle.

### 6) Netzwerk- und Durchsatzanforderungen

* Mindestbetrag **1 Gbps** (symmetrisch), vorzugsweise **10 Gbps** mit Redundanz.
* Öffentliche IPv4, rDNS-Unterstützung auf Anfrage; IPv6 ist wünschenswert.
* Basis-ACLs, Anti-DDoS-Profil, dedizierte **mgmt-VLAN** für IPMI.
* Für **InfiniBand** — direkte L2-Segmentierung innerhalb des Racks/Raums und OFED-Verfügbarkeit.

***

### 7) Beispiel-Workloads

* **Multi-GPU LLM-Training:** 8×L40S/NVLink oder ein IB-Cluster aus A100/H100/H200-Nodes.
* **Video-Rendering:** 4×RTX 4090/5090 mit lokalem NVMe-Cache und **10 Gbps** Egress.
* **HFT/Trading:** niedrige Latenzen, CPU **64–128** Threads, RAM **256–512 GB**, NVMe **RAID1** und **10 Gbps** Netzwerk.
* **Genomik/HPC:** A100/H100 mit IB **HDR/NDR**, **SLURM** / MPI-Unterstützung.

***

## Vergleich zwischen Standardvermietung und Bare Metal

| Parameter                       | Standardvermietung (HiveOS/Docker)                            | Bare Metal                                                               |
| ------------------------------- | ------------------------------------------------------------- | ------------------------------------------------------------------------ |
| Was es ist                      | Container/Umgebung innerhalb des Host-OS                      | Ganze physische Server                                                   |
| Ressourcen (CPU/RAM/Bandbreite) | Vom Scheduler geteilt; cgroup-Quotas, mögliche Drosselung     | Exklusiv; vorhersehbare CPU/RAM/Bandbreite                               |
| Root/Privilegien                | root innerhalb des Containers, kein BIOS-Zugriff              | Voller Server-Root; BIOS/UEFI-Zugriff                                    |
| GPU-Treiber (CUDA/NVIDIA)       | Version vom Host festgelegt                                   | Sie installieren die benötigten Versionen (CUDA/OFED usw.)               |
| GPU-Steuerung                   | Passthrough mit Einschränkungen (PL/OC gemäß Host-Policy)     | Volle PL/OC-Kontrolle; NVLink/NVSwitch (falls vorhanden)                 |
| IPMI/KVM/Virtual Media          | Nein                                                          | Ja (Fernkonsole, ISO-Einbindung)                                         |
| Speicher                        | Host-Volumes/Mounts; Bandbreite kann schwanken                | Direktes NVMe/RAID; stabile IOPS/Durchsatz                               |
| Netzwerk                        | Ports/NAT/geteilte Bandbreite                                 | Dedizierte NIC 1–10G+; rDNS, VLAN; öffentliche IPv4                      |
| Zuverlässigkeit / SLA           | Abhängig vom Host; kein garantierter gleichwertiger Austausch | DC Tier 3+, Ziel-SLA 99,99%, verpflichtender gleichwertiger Ersatz       |
| Mindestlaufzeit                 | Üblicherweise Stunden/Tage                                    | Ab 2 Wochen                                                              |
| Kosten                          | Niedriger                                                     | Höher (exklusiv + Rechenzentrum)                                         |
| Zeit bis zum Start              | Sekunden–Minuten                                              | von 1 Std. bis zu 48 Std. bis zum Start                                  |
| HPC / InfiniBand                | Üblicherweise nein                                            | Empfohlen (InfiniBand), NVLink/NVSwitch                                  |
| Am besten für                   | Schnelle Aufgaben, Tests, Mining, kurze Sessions              | AI/ML/HPC, Produktions-Workloads, lange Projekte                         |
| Anforderungen an den Anbieter   | Grundlegend                                                   | Juristische Person, DC Tier 3+, 24/7 NOC, regionale Preisgestaltung, API |
| Sicherheit / Daten              | Innerhalb der Host-Policies                                   | Festplatten-Säuberung zwischen Vermietungen, isoliertes mgmt (IPMI)      |

## FAQ

**Worin unterscheidet sich Bare Metal von Containervermietung?**\
Bare Metal ist **vollständig Ihre physische Maschine** (CPU/RAM/Festplatte/Netz/GPU). Bei Containervermietung werden Ressourcen geteilt und Sie arbeiten in einer isolierten Umgebung.

**Ist IPMI erforderlich?**\
Bevorzugt. Es beschleunigt die Neuinstallation des OS und bietet KVM-Zugriff, besonders bei Netzwerk-/SSH-Problemen.

**Können Nodes über IB verbunden werden?**\
Ja, InfiniBand wird für verteiltes Training/HPC empfohlen. Geben Sie die IB-Bandbreite/den Typ im SKU an.

**Was ist das Minimum für GPUs?**\
L40S / H200-Level und höher, oder ein Äquivalent, das gegenüber schweren Workloads resilient ist (B200, H100, A100 usw.).

**Was, wenn der Server „ausfällt“?**\
Der Anbieter muss umgehend einen **identischen Ersatz liefern** ohne Verschlechterung (SLA 99,99%).


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/clore.ai/clore.ai-eng-de/fur-hosts/advanced/bare-metal.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
