Bare Metal

Clore Bare Metal — требования и руководство

Clore Bare Metal — это физические (не виртуализированные) серверы с полным root-доступом, без шеринга и ограничений по мощности. Подходит для AI/ML, HPC, 3D-рендеринга, любых тяжёлых рабочих нагрузок.

Доступные GPU (пример): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090 и т.д. Локации (старт): США, Япония, Гонконг и другие SLA: дата-центры Tier 3 и выше, целевой аптайм 99.99%.


1) Что такое Bare Metal на Clore

  • Вы получаете целую физическую машину (CPU, RAM, диски, сеть, GPU).

  • Полный root-доступ/SSH и при наличии — IPMI/KVM для переустановки ОС.

  • Без лимитов PL/изолирующих прослоек — производительность соответствует «железу».

  • Отличается от контейнерной аренды (HiveOS/Docker) тем, что ресурсы не шарятся.


2) Обязательные требования к инфраструктуре (для поставщиков)

2.1 Дата-центр

  • Минимум Tier 3 (Uptime Institute или признанный локальный эквивалент).

  • Документы: письмо/сертификат DC, описание резервирования (электропитание N+1/2N, охлаждение, сеть).

  • SLA 99.99% с круглосуточным NOC.

  • Соответствие нормам пожарной безопасности, доступность аварийных процедур (RPO/RTO).

  • Только юридические лица. Домашние/офисные «серверные» не принимаются.

2.2 Аппаратная база (минимум)

  • CPU: от 64 потоков.

  • RAM: от 128 GB (рекомендовано 256 GB+ для multi-GPU/HPC).

  • Storage: NVMe SSD ≥ 1 TB, скорость ≥ 1 GB/s (рекомендовано RAID1/10 для системного и данных).

  • Сеть: ≥ 1 Gbps симметрично (предпочтительно 10 Gbps, L2/L3 резервирование, статика IPv4; IPv6 — плюс).

  • GPU (уровень): L40S / H200 и выше либо эквиваленты по устойчивости к heavy workload: B200, H100, H200, A100, L40S, RTX 4090/5090 (серверные A-серии и дата-центровые предпочтительнее).

2.3 Высокопроизводительные межсоединения (желательно)

  • InfiniBand (EDR/HDR/NDR) для распределённого обучения/ HPC.

  • NVLink/NVSwitch — желательны для multi-GPU в рамках узла.

2.4 Надёжность и замена

  • При аппаратной аварии — замена «один-в-один» (идентичная или строго эквивалентная конфигурация) без ухудшения SLA.

  • Обязательный запас комплектующих/«горячие» резервы.

2.5 Безопасность и гигиена данных

  • Стерилизация дисков между арендами: blkdiscard/secure erase/1-pass zero/TRIM (журналирование).

  • Изоляция IPMI, закрытый mgmt-контур, ACL/DDoS-профиль.

  • Образы ОС — проверенные, с актуальными микрокодами/патчами, поддержка NVIDIA-драйверов.


3) Минимальные коммерческие условия

  • Минимальный срок аренды: от 1 месяца.

  • Ценообразование: прайс-листы конкурентны в разрезе геолокации (учёт стоимости трафика/электроэнергии/НДС).

  • API-интеграция обязательна/желательна (в зависимости от объёма) для автопровижининга, продления и мониторинга.


4) Требования к ПО и образам

  • ОС: Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9, по запросу — Windows Server (с лицензированием).

  • GPU-стек: NVIDIA 550.xx+ (или рекомендованные для конкретных GPU), CUDA 12.2/12.4+.

  • Менеджмент: SSH (обяз.), IPMI/KVM (желательно) с временными учётками для арендатора.

  • Контейнеризация: Docker/Podman по запросу, Kubernetes — допустим при выделении мастера в том же DC.


5) Как поставщику подключиться к Bare Metal

  1. Заявка и верификация:

    • Юрлицо, официальный договор с DC Tier 3+, SLA 99.99%, NOC 24/7.

    • Пакет документов: сертификат Tier/эквивалент, SLA, пожарная безопасность, схема резервирования.

    • Тест-оконечности: публичный IPv4, скриншот/доступ к IPMI (KVM), результаты iPerf3/дисковой производительности.

  2. Каталог SKU и прайс:

    • Стандартизированные карточки (GPU-состав, CPU-потоки, RAM, NVMe, сеть, IB/NVLink, DC/локация, лимиты трафика).

    • Цены с привязкой к географии. Минимальный срок — 2 недели.

  3. Операционные политики:

    • Срок реакции на инцидент: ≤ 15 мин, замена железа: эквивалент немедленно.

    • Логирование стерилизации дисков, закрытие админ-доступов после сдачи, аудит.

    • Ежемесячный отчёт по аптайму/инцидентам.


6) Сетевые и пропускные требования

  • Минимум 1 Gbps (симметрия), предпочтительно 10 Gbps с резервированием.

  • Публичный IPv4, поддержка rDNS по запросу, IPv6 — желательно.

  • Базовые ACL, анти-DDoS профиль, отдельный mgmt-VLAN для IPMI.

  • Для InfiniBand — прямая L2-сегментация внутри стойки/зала и доступность OFED.


7) Примеры рабочих сценариев

  • Multi-GPU обучение LLM: 8×L40S/NVLink или IB-кластер из узлов A100/H100/H200.

  • Видеорендеринг: 4×RTX 4090/5090 с локальным NVMe кэшем и 10G выгрузкой.

  • HFT/трейдинг: низкие латентности, CPU 64–128t, RAM 256–512 GB, NVMe RAID1 и сетевой 10G.

  • Геномика/HPC: A100/H100 с IB HDR/NDR, SLURM/поддержка MPI.


Сравнение обычной аренды и Bare Metal

Параметр
Обычная аренда (HiveOS/Docker)
Bare Metal

Что это

Контейнер/окружение внутри хост-ОС

Физический сервер целиком

Ресурсы (CPU/RAM/bandwidth)

Делятся планировщиком; квоты (cgroups), возможен throttling

Эксклюзивные; предсказуемые CPU/RAM/bandwidth

Root/права

root внутри контейнера, без доступа к BIOS

Полный root сервера; доступ к BIOS/UEFI

Драйверы GPU (CUDA/NVIDIA)

Версия определяется хостом

Устанавливаете нужные версии (CUDA/OFED и т.д.)

Управление GPU

Проброс с ограничениями (PL/OC — по политике хоста)

Полный контроль PL/OC; NVLink/NVSwitch (если есть)

IPMI/KVM/Virtual Media

Нет

Есть (удалённая консоль, монтирование ISO)

Диски/хранилище

Том/маунт хоста; bandwidth может колебаться

Прямой NVMe/RAID; стабильные IOPS/throughput

Сеть

Порты/NAT/общая полоса

Выделенная NIC 1–10G+; rDNS, VLAN; публичный IPv4

Надёжность/SLA

Зависит от хоста, без гарантии «1:1» замены

DC Tier 3+, целевой SLA 99.99%, обязательная замена «один-к-одному»

Минимальный срок

Обычно часы/дни

От 2 недель

Стоимость

Ниже

Выше (эксклюзив + дата-центр)

Время старта

Секунды–минуты

от 1 часа до 48 часов

HPC/InfiniBand

Обычно нет

Рекомендуется (InfiniBand), NVLink/NVSwitch

Кому подходит

Быстрые задачи, тесты, майнинг, короткие сессии

AI/ML/HPC, продакшн-нагрузки, долгие проекты

Требования к поставщику

Базовые

Юрлицо, DC Tier 3+, NOC 24/7, прайс по региону, API

Безопасность/данные

В рамках политик хоста

Стерилизация дисков между арендами, изолированный mgmt (IPMI)

FAQ

Чем Bare Metal отличается от контейнерной аренды? Bare Metal — это целиком ваша физическая машина (CPU/RAM/Disk/Net/GPU). В контейнерной аренде ресурсы шарятся, и вы работаете в изолированном окружении.

IPMI обязателен? Желательно. Это ускоряет переустановку ОС и даёт KVM-доступ, особенно при сетевых/SSH-проблемах.

Можно ли объединять узлы по IB? Да, InfiniBand приветствуется для распределённых обучений/HPC. Указывайте полосу/тип IB в SKU.

Какой минимум по GPU? Уровень L40S / H200 и выше либо эквивалент по выносливости к heavy workload (B200, H100, A100 и т. д.).

Что, если сервер «упал»? Поставщик обязан оперативно предоставить идентичную замену без деградации (SLA 99.99%).

Last updated

Was this helpful?