Дополнительно

Clore Bare Metal — Требования и Руководство

Clore Bare Metal физические (невиртуализированные) серверы с полным root-доступом, без шаринга и без ограничений мощности. Подходят для AI/ML, HPC, 3D-рендеринга и любых тяжёлых нагрузок.

Доступные GPU (примеры): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090 и т.д. Локации (старт): США, Япония, Гонконг и другие SLA: ЦОД уровня Tier 3 и выше, целевая доступность 99.99%.


1) Что такое Bare Metal на Clore

  • Вы получаете целую физическую машину (CPU, RAM, диски, сеть, GPU).

  • Полный root-доступ/SSH и, при наличии, IPMI/KVM для переустановки ОС.

  • Отсутствие ограничений PL / слоёв изоляции — производительность соответствует оборудованию.

  • Отличается от аренды на основе контейнеров (HiveOS/Docker) тем, что ресурсы не разделяются.


2) Обязательные требования к инфраструктуре (для провайдеров)

2.1 Дата-центр

  • Минимум Уровень 3 (Uptime Institute или признимый местный эквивалент).

  • Документы: письмо/сертификат ЦОД, описание резервирования (питание N+1/2N, охлаждение, сеть).

  • SLA 99.99% с круглосуточным NOC.

  • Соответствие стандартам пожарной безопасности; наличие аварийных процедур (RPO/RTO).

  • Только юридические лица. Домашние/офисные «серверные» не принимаются.

2.2 Аппаратная база (минимум)

  • CPU: от 64 потоков.

  • ОЗУ: от 128 ГБ (рекомендуется 256 ГБ+ для мульти-GPU/HPC).

  • Хранилище: NVMe SSD ≥ 1 ТБ, пропускная способность ≥ 1 ГБ/с (рекомендуется RAID1/10 для системы и данных).

  • Сеть: ≥ 1 Гбит/с симметрично (предпочтительно 10 Гбит/с, резервирование L2/L3, статический IPv4; IPv6 — плюс).

  • GPU (уровень): L40S / H200 и выше или эквиваленты, устойчивые к тяжёлым нагрузкам: B200, H100, H200, A100, L40S, RTX 4090/5090 (предпочтительны серверные A-series и дата-центровые карты).

2.3 Высокопроизводительные интерконнекты (предпочтительно)

  • InfiniBand (EDR/HDR/NDR) для распределённого обучения/HPC.

  • NVLink/NVSwitch — желательны для мульти-GPU внутри ноды.

2.4 Надёжность и замена

  • В случае сбоя оборудования — замена один к одному (идентичная или строго эквивалентная конфигурация) без ухудшения SLA.

  • Обязательный запас запчастей / «горячие» резервы.

2.5 Безопасность и гигиена данных

  • Стерилизация дисков между арендами: blkdiscard/secure erase/1-pass zero/TRIM (логирование).

  • Изоляция IPMI, закрытая управляющая периметр, ACL/DDoS профиль.

  • Образы ОС — проверенные, с актуальными микрокодами/патчами, поддержкой NVIDIA драйверов.


3) Минимальные коммерческие условия

  • Минимальный срок аренды: от 1 месяц.

  • Ценообразование: прайс-листы конкурентны по геолокации (с учётом трафика/электроэнергии/НДС).

  • Интеграция через API обязательна/желательна (в зависимости от объёмов) для авто-провиженинга, продлений и мониторинга.


4) Требования к ПО и образам

  • ОС: Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9; по запросу — Windows Server (с лицензированием).

  • GPU-стек: NVIDIA 550.xx+ (или версии, рекомендованные для конкретных GPU), CUDA 12.2/12.4+.

  • Управление: SSH (обязательно), IPMI/KVM (предпочтительно) с временными учётными записями для арендатора.

  • Контейнеризация: Docker/Podman по запросу; Kubernetes — разрешён при развёртывании мастера в том же ЦОДе.


5) Как провайдер может подключиться к Bare Metal

  1. Заявка и верификация:

    • Юридическое лицо, официальный контракт с ЦОД Tier 3+, SLA 99.99%, круглосуточный NOC.

    • Пакет документов: сертификат Tier/эквивалента, SLA, пожарная безопасность, схема резервирования.

    • Приёмочные тесты: публичный IPv4, скриншот/доступ к IPMI (KVM), результаты iPerf3/производительности диска.

  2. Каталог SKU и ценообразование:

    • Стандартизованные карточки (состав GPU, потоки CPU, RAM, NVMe, сеть, IB/NVLink, ЦОД/локация, лимиты трафика).

    • Цены привязаны к географии. Минимальный срок — 2 недели.

  3. Операционные политики:

    • Время реакции на инцидент: ≤ 15 мин; замена оборудования: эквивалентная немедленно.

    • Логирование стерилизации дисков, закрытие доступа админа после возврата, аудит.

    • Ежемесячные отчёты по времени работы/инцидентам.

6) Требования к сети и пропускной способности

  • Минимум 1 Гбит/с (симметрично), предпочтительно 10 Гбит/с с резервированием.

  • Публичный IPv4, поддержка rDNS по запросу; IPv6 желателен.

  • Базовые ACL, anti-DDoS профиль, выделенный mgmt-VLAN для IPMI.

  • Для InfiniBand — прямое L2-сегментирование внутри стойки/комнаты и доступность OFED.


7) Примеры рабочих нагрузок

  • Тренировка LLM на нескольких GPU: 8×L40S/NVLink или кластер IB из узлов A100/H100/H200.

  • Видеорендеринг: 4×RTX 4090/5090 с локальным NVMe-кэшом и 10 Гбит/с выходящим трафиком.

  • HFT/трейдинг: низкие задержки, CPU 64–128 потоков, ОЗУ 256–512 ГБ, NVMe RAID1 и 10 Гбит/с сеть.

  • Геномика/HPC: A100/H100 с IB HDR/NDR, SLURM / поддержкой MPI.


Сравнение стандартной аренды и Bare Metal

Параметр
Стандартная аренда (HiveOS/Docker)
Bare Metal

Что это такое

Контейнер/окружение внутри хост-ОС

Целый физический сервер

Ресурсы (CPU/RAM/пропускная способность)

Разделяются планировщиком; квоты cgroup, возможное троттлирование

Эксклюзивные; предсказуемые CPU/RAM/пропускная способность

Root/привилегии

root внутри контейнера, доступа к BIOS нет

Полный root сервера; доступ к BIOS/UEFI

Драйверы GPU (CUDA/NVIDIA)

Версия задаётся хостом

Вы устанавливаете требуемые версии (CUDA/OFED и т.д.)

Управление GPU

Passthrough с ограничениями (PL/OC по политике хоста)

Полный контроль PL/OC; NVLink/NVSwitch (если есть)

IPMI/KVM/Virtual Media

Нет

Да (удалённая консоль, монтирование ISO)

Хранилище

Тома/маунты хоста; пропускная способность может меняться

Прямые NVMe/RAID; стабильные IOPS/пропускная способность

Сеть

Порты/NAT/общая пропускная способность

Выделенная NIC 1–10G+; rDNS, VLAN; публичный IPv4

Надёжность / SLA

Зависит от хоста; нет гарантированной замены один к одному

ЦОД Tier 3+, целевое SLA 99.99%, обязательная замена один к одному

Минимальный срок

Обычно часы/дни

От 2 недель

Стоимость

Ниже

Выше (эксклюзивно + дата-центр)

Время запуска

Секунды–минуты

от 1 ч до 48 ч на запуск

HPC / InfiniBand

Обычно нет

Рекомендуется (InfiniBand), NVLink/NVSwitch

Лучше всего подходит для

Быстрые задачи, тесты, майнинг, короткие сессии

AI/ML/HPC, продакшен- нагрузки, долгие проекты

Требования к провайдеру

Базовые

Юридическое лицо, ЦОД Tier 3+, круглосуточный NOC, региональное ценообразование, API

Безопасность / данные

В рамках политик хоста

Санитизация дисков между арендами, изолированное управление (IPMI)

ЧаВо

Чем Bare Metal отличается от аренды контейнера? Bare Metal — это полностью ваша физическая машина (CPU/RAM/Диск/Сеть/GPU). При аренде контейнера ресурсы разделяются и вы работаете в изолированном окружении.

Требуется ли IPMI? Предпочтительно. Это ускоряет переустановку ОС и даёт доступ KVM, особенно при проблемах с сетью/SSH.

Можно ли соединять узлы по IB? Да, InfiniBand приветствуется для распределённого обучения/HPC. Укажите пропускную способность/тип IB в SKU.

Каковы минимальные требования к GPU? Уровень L40S / H200 и выше, или эквивалент, устойчивый к тяжёлым нагрузкам (B200, H100, A100 и т.д.).

Что если сервер «упал»? Провайдер должен незамедлительно предоставить идентичную замену без ухудшения (SLA 99.99%).

Последнее обновление

Это было полезно?