# Bare Metal

## Clore Bare Metal — Требования и Руководство

**Clore Bare Metal** физические (невиртуализированные) серверы с полным root-доступом, без шаринга и без ограничений мощности. Подходят для AI/ML, HPC, 3D-рендеринга и любых тяжёлых нагрузок.

**Доступные GPU (примеры):** B200, H100, H200, A100, L40S, RTX 5090, RTX 4090 и т.д.\
**Локации (старт):** США, Япония, Гонконг и другие\
**SLA:** ЦОД уровня Tier 3 и выше, целевая доступность **99.99%**.

***

### 1) Что такое Bare Metal на Clore

* Вы получаете целую физическую машину (CPU, RAM, диски, сеть, GPU).
* Полный root-доступ/SSH и, при наличии, IPMI/KVM для переустановки ОС.
* Отсутствие ограничений PL / слоёв изоляции — производительность соответствует оборудованию.
* Отличается от аренды на основе контейнеров (HiveOS/Docker) тем, что ресурсы не разделяются.

***

### 2) Обязательные требования к инфраструктуре (для провайдеров)

**2.1 Дата-центр**

* Минимум **Уровень 3** (Uptime Institute или признимый местный эквивалент).
* Документы: письмо/сертификат ЦОД, описание резервирования (питание N+1/2N, охлаждение, сеть).
* **SLA 99.99%** с круглосуточным NOC.
* Соответствие стандартам пожарной безопасности; наличие аварийных процедур (RPO/RTO).
* **Только юридические лица.** Домашние/офисные «серверные» не принимаются.

**2.2 Аппаратная база (минимум)**

* **CPU:** от 64 потоков.
* **ОЗУ:** от 128 ГБ (рекомендуется 256 ГБ+ для мульти-GPU/HPC).
* **Хранилище:** NVMe SSD ≥ 1 ТБ, пропускная способность ≥ 1 ГБ/с (рекомендуется RAID1/10 для системы и данных).
* **Сеть:** ≥ 1 Гбит/с симметрично (предпочтительно 10 Гбит/с, резервирование L2/L3, статический IPv4; IPv6 — плюс).
* **GPU (уровень):** L40S / H200 и выше или эквиваленты, устойчивые к тяжёлым нагрузкам:\
  B200, H100, H200, A100, L40S, RTX 4090/5090 (**предпочтительны серверные A-series и дата-центровые карты**).

**2.3 Высокопроизводительные интерконнекты (предпочтительно)**

* **InfiniBand** (EDR/HDR/NDR) для распределённого обучения/HPC.
* **NVLink/NVSwitch** — желательны для мульти-GPU внутри ноды.

#### 2.4 Надёжность и замена

* В случае сбоя оборудования — **замена один к одному** (идентичная или строго эквивалентная конфигурация) без ухудшения SLA.
* Обязательный запас запчастей / «горячие» резервы.

#### 2.5 Безопасность и гигиена данных

* Стерилизация дисков между арендами: **blkdiscard/secure erase/1-pass zero/TRIM** (логирование).
* Изоляция IPMI, закрытая **управляющая** периметр, ACL/DDoS профиль.
* Образы ОС — проверенные, с актуальными микрокодами/патчами, поддержкой **NVIDIA** драйверов.

***

### 3) Минимальные коммерческие условия

* **Минимальный срок аренды:** от **1 месяц**.
* **Ценообразование:** прайс-листы конкурентны по геолокации (с учётом трафика/электроэнергии/НДС).
* **Интеграция через API** обязательна/желательна (в зависимости от объёмов) для авто-провиженинга, продлений и мониторинга.

***

### 4) Требования к ПО и образам

* **ОС:** Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9; по запросу — Windows Server (с лицензированием).
* **GPU-стек:** NVIDIA 550.xx+ (или версии, рекомендованные для конкретных GPU), CUDA 12.2/12.4+.
* **Управление:** SSH (обязательно), IPMI/KVM (предпочтительно) с временными учётными записями для арендатора.
* **Контейнеризация:** Docker/Podman по запросу; Kubernetes — разрешён при развёртывании мастера в том же ЦОДе.

***

### 5) Как провайдер может подключиться к Bare Metal

1. **Заявка и верификация:**
   * Юридическое лицо, официальный контракт с ЦОД Tier 3+, SLA 99.99%, круглосуточный NOC.
   * Пакет документов: сертификат Tier/эквивалента, SLA, пожарная безопасность, схема резервирования.
   * Приёмочные тесты: публичный IPv4, скриншот/доступ к IPMI (KVM), результаты iPerf3/производительности диска.
2. **Каталог SKU и ценообразование:**
   * Стандартизованные карточки (состав GPU, потоки CPU, RAM, NVMe, сеть, IB/NVLink, ЦОД/локация, лимиты трафика).
   * Цены привязаны к географии. Минимальный срок — 2 недели.
3. **Операционные политики:**
   * Время реакции на инцидент: ≤ 15 мин; замена оборудования: эквивалентная немедленно.
   * Логирование стерилизации дисков, закрытие доступа админа после возврата, аудит.
   * Ежемесячные отчёты по времени работы/инцидентам.

### 6) Требования к сети и пропускной способности

* Минимум **1 Гбит/с** (симметрично), предпочтительно **10 Гбит/с** с резервированием.
* Публичный IPv4, поддержка rDNS по запросу; IPv6 желателен.
* Базовые ACL, anti-DDoS профиль, выделенный **mgmt-VLAN** для IPMI.
* Для **InfiniBand** — прямое L2-сегментирование внутри стойки/комнаты и доступность OFED.

***

### 7) Примеры рабочих нагрузок

* **Тренировка LLM на нескольких GPU:** 8×L40S/NVLink или кластер IB из узлов A100/H100/H200.
* **Видеорендеринг:** 4×RTX 4090/5090 с локальным NVMe-кэшом и **10 Гбит/с** выходящим трафиком.
* **HFT/трейдинг:** низкие задержки, CPU **64–128** потоков, ОЗУ **256–512 ГБ**, NVMe **RAID1** и **10 Гбит/с** сеть.
* **Геномика/HPC:** A100/H100 с IB **HDR/NDR**, **SLURM** / поддержкой MPI.

***

## Сравнение стандартной аренды и Bare Metal

| Параметр                                 | Стандартная аренда (HiveOS/Docker)                                | Bare Metal                                                                           |
| ---------------------------------------- | ----------------------------------------------------------------- | ------------------------------------------------------------------------------------ |
| Что это такое                            | Контейнер/окружение внутри хост-ОС                                | Целый физический сервер                                                              |
| Ресурсы (CPU/RAM/пропускная способность) | Разделяются планировщиком; квоты cgroup, возможное троттлирование | Эксклюзивные; предсказуемые CPU/RAM/пропускная способность                           |
| Root/привилегии                          | root внутри контейнера, доступа к BIOS нет                        | Полный root сервера; доступ к BIOS/UEFI                                              |
| Драйверы GPU (CUDA/NVIDIA)               | Версия задаётся хостом                                            | Вы устанавливаете требуемые версии (CUDA/OFED и т.д.)                                |
| Управление GPU                           | Passthrough с ограничениями (PL/OC по политике хоста)             | Полный контроль PL/OC; NVLink/NVSwitch (если есть)                                   |
| IPMI/KVM/Virtual Media                   | Нет                                                               | Да (удалённая консоль, монтирование ISO)                                             |
| Хранилище                                | Тома/маунты хоста; пропускная способность может меняться          | Прямые NVMe/RAID; стабильные IOPS/пропускная способность                             |
| Сеть                                     | Порты/NAT/общая пропускная способность                            | Выделенная NIC 1–10G+; rDNS, VLAN; публичный IPv4                                    |
| Надёжность / SLA                         | Зависит от хоста; нет гарантированной замены один к одному        | ЦОД Tier 3+, целевое SLA 99.99%, обязательная замена один к одному                   |
| Минимальный срок                         | Обычно часы/дни                                                   | От 2 недель                                                                          |
| Стоимость                                | Ниже                                                              | Выше (эксклюзивно + дата-центр)                                                      |
| Время запуска                            | Секунды–минуты                                                    | от 1 ч до 48 ч на запуск                                                             |
| HPC / InfiniBand                         | Обычно нет                                                        | Рекомендуется (InfiniBand), NVLink/NVSwitch                                          |
| Лучше всего подходит для                 | Быстрые задачи, тесты, майнинг, короткие сессии                   | AI/ML/HPC, продакшен- нагрузки, долгие проекты                                       |
| Требования к провайдеру                  | Базовые                                                           | Юридическое лицо, ЦОД Tier 3+, круглосуточный NOC, региональное ценообразование, API |
| Безопасность / данные                    | В рамках политик хоста                                            | Санитизация дисков между арендами, изолированное управление (IPMI)                   |

## ЧаВо

**Чем Bare Metal отличается от аренды контейнера?**\
Bare Metal — это **полностью ваша физическая машина** (CPU/RAM/Диск/Сеть/GPU). При аренде контейнера ресурсы разделяются и вы работаете в изолированном окружении.

**Требуется ли IPMI?**\
Предпочтительно. Это ускоряет переустановку ОС и даёт доступ KVM, особенно при проблемах с сетью/SSH.

**Можно ли соединять узлы по IB?**\
Да, InfiniBand приветствуется для распределённого обучения/HPC. Укажите пропускную способность/тип IB в SKU.

**Каковы минимальные требования к GPU?**\
Уровень L40S / H200 и выше, или эквивалент, устойчивый к тяжёлым нагрузкам (B200, H100, A100 и т.д.).

**Что если сервер «упал»?**\
Провайдер должен незамедлительно предоставить **идентичную замену** без ухудшения (SLA 99.99%).


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/clore.ai/clore.ai-ru/dlya-khostov/advanced/bare-metal.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
