Bare Metal
Clore Bare Metal — требования и руководство
Clore Bare Metal — это физические (не виртуализированные) серверы с полным root-доступом, без шеринга и ограничений по мощности. Подходит для AI/ML, HPC, 3D-рендеринга, любых тяжёлых рабочих нагрузок.
Доступные GPU (пример): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090 и т.д. Локации (старт): США, Япония, Гонконг и другие SLA: дата-центры Tier 3 и выше, целевой аптайм 99.99%.
1) Что такое Bare Metal на Clore
Вы получаете целую физическую машину (CPU, RAM, диски, сеть, GPU).
Полный root-доступ/SSH и при наличии — IPMI/KVM для переустановки ОС.
Без лимитов PL/изолирующих прослоек — производительность соответствует «железу».
Отличается от контейнерной аренды (HiveOS/Docker) тем, что ресурсы не шарятся.
2) Обязательные требования к инфраструктуре (для поставщиков)
2.1 Дата-центр
Минимум Tier 3 (Uptime Institute или признанный локальный эквивалент).
Документы: письмо/сертификат DC, описание резервирования (электропитание N+1/2N, охлаждение, сеть).
SLA 99.99% с круглосуточным NOC.
Соответствие нормам пожарной безопасности, доступность аварийных процедур (RPO/RTO).
Только юридические лица. Домашние/офисные «серверные» не принимаются.
2.2 Аппаратная база (минимум)
CPU: от 64 потоков.
RAM: от 128 GB (рекомендовано 256 GB+ для multi-GPU/HPC).
Storage: NVMe SSD ≥ 1 TB, скорость ≥ 1 GB/s (рекомендовано RAID1/10 для системного и данных).
Сеть: ≥ 1 Gbps симметрично (предпочтительно 10 Gbps, L2/L3 резервирование, статика IPv4; IPv6 — плюс).
GPU (уровень): L40S / H200 и выше либо эквиваленты по устойчивости к heavy workload: B200, H100, H200, A100, L40S, RTX 4090/5090 (серверные A-серии и дата-центровые предпочтительнее).
2.3 Высокопроизводительные межсоединения (желательно)
InfiniBand (EDR/HDR/NDR) для распределённого обучения/ HPC.
NVLink/NVSwitch — желательны для multi-GPU в рамках узла.
2.4 Надёжность и замена
При аппаратной аварии — замена «один-в-один» (идентичная или строго эквивалентная конфигурация) без ухудшения SLA.
Обязательный запас комплектующих/«горячие» резервы.
2.5 Безопасность и гигиена данных
Стерилизация дисков между арендами: blkdiscard/secure erase/1-pass zero/TRIM (журналирование).
Изоляция IPMI, закрытый mgmt-контур, ACL/DDoS-профиль.
Образы ОС — проверенные, с актуальными микрокодами/патчами, поддержка NVIDIA-драйверов.
3) Минимальные коммерческие условия
Минимальный срок аренды: от 1 месяца.
Ценообразование: прайс-листы конкурентны в разрезе геолокации (учёт стоимости трафика/электроэнергии/НДС).
API-интеграция обязательна/желательна (в зависимости от объёма) для автопровижининга, продления и мониторинга.
4) Требования к ПО и образам
ОС: Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9, по запросу — Windows Server (с лицензированием).
GPU-стек: NVIDIA 550.xx+ (или рекомендованные для конкретных GPU), CUDA 12.2/12.4+.
Менеджмент: SSH (обяз.), IPMI/KVM (желательно) с временными учётками для арендатора.
Контейнеризация: Docker/Podman по запросу, Kubernetes — допустим при выделении мастера в том же DC.
5) Как поставщику подключиться к Bare Metal
Заявка и верификация:
Юрлицо, официальный договор с DC Tier 3+, SLA 99.99%, NOC 24/7.
Пакет документов: сертификат Tier/эквивалент, SLA, пожарная безопасность, схема резервирования.
Тест-оконечности: публичный IPv4, скриншот/доступ к IPMI (KVM), результаты iPerf3/дисковой производительности.
Каталог SKU и прайс:
Стандартизированные карточки (GPU-состав, CPU-потоки, RAM, NVMe, сеть, IB/NVLink, DC/локация, лимиты трафика).
Цены с привязкой к географии. Минимальный срок — 2 недели.
Операционные политики:
Срок реакции на инцидент: ≤ 15 мин, замена железа: эквивалент немедленно.
Логирование стерилизации дисков, закрытие админ-доступов после сдачи, аудит.
Ежемесячный отчёт по аптайму/инцидентам.
6) Сетевые и пропускные требования
Минимум 1 Gbps (симметрия), предпочтительно 10 Gbps с резервированием.
Публичный IPv4, поддержка rDNS по запросу, IPv6 — желательно.
Базовые ACL, анти-DDoS профиль, отдельный mgmt-VLAN для IPMI.
Для InfiniBand — прямая L2-сегментация внутри стойки/зала и доступность OFED.
7) Примеры рабочих сценариев
Multi-GPU обучение LLM: 8×L40S/NVLink или IB-кластер из узлов A100/H100/H200.
Видеорендеринг: 4×RTX 4090/5090 с локальным NVMe кэшем и 10G выгрузкой.
HFT/трейдинг: низкие латентности, CPU 64–128t, RAM 256–512 GB, NVMe RAID1 и сетевой 10G.
Геномика/HPC: A100/H100 с IB HDR/NDR, SLURM/поддержка MPI.
Сравнение обычной аренды и Bare Metal
Что это
Контейнер/окружение внутри хост-ОС
Физический сервер целиком
Ресурсы (CPU/RAM/bandwidth)
Делятся планировщиком; квоты (cgroups), возможен throttling
Эксклюзивные; предсказуемые CPU/RAM/bandwidth
Root/права
root внутри контейнера, без доступа к BIOS
Полный root сервера; доступ к BIOS/UEFI
Драйверы GPU (CUDA/NVIDIA)
Версия определяется хостом
Устанавливаете нужные версии (CUDA/OFED и т.д.)
Управление GPU
Проброс с ограничениями (PL/OC — по политике хоста)
Полный контроль PL/OC; NVLink/NVSwitch (если есть)
IPMI/KVM/Virtual Media
Нет
Есть (удалённая консоль, монтирование ISO)
Диски/хранилище
Том/маунт хоста; bandwidth может колебаться
Прямой NVMe/RAID; стабильные IOPS/throughput
Сеть
Порты/NAT/общая полоса
Выделенная NIC 1–10G+; rDNS, VLAN; публичный IPv4
Надёжность/SLA
Зависит от хоста, без гарантии «1:1» замены
DC Tier 3+, целевой SLA 99.99%, обязательная замена «один-к-одному»
Минимальный срок
Обычно часы/дни
От 2 недель
Стоимость
Ниже
Выше (эксклюзив + дата-центр)
Время старта
Секунды–минуты
от 1 часа до 48 часов
HPC/InfiniBand
Обычно нет
Рекомендуется (InfiniBand), NVLink/NVSwitch
Кому подходит
Быстрые задачи, тесты, майнинг, короткие сессии
AI/ML/HPC, продакшн-нагрузки, долгие проекты
Требования к поставщику
Базовые
Юрлицо, DC Tier 3+, NOC 24/7, прайс по региону, API
Безопасность/данные
В рамках политик хоста
Стерилизация дисков между арендами, изолированный mgmt (IPMI)
FAQ
Чем Bare Metal отличается от контейнерной аренды? Bare Metal — это целиком ваша физическая машина (CPU/RAM/Disk/Net/GPU). В контейнерной аренде ресурсы шарятся, и вы работаете в изолированном окружении.
IPMI обязателен? Желательно. Это ускоряет переустановку ОС и даёт KVM-доступ, особенно при сетевых/SSH-проблемах.
Можно ли объединять узлы по IB? Да, InfiniBand приветствуется для распределённых обучений/HPC. Указывайте полосу/тип IB в SKU.
Какой минимум по GPU? Уровень L40S / H200 и выше либо эквивалент по выносливости к heavy workload (B200, H100, A100 и т. д.).
Что, если сервер «упал»? Поставщик обязан оперативно предоставить идентичную замену без деградации (SLA 99.99%).
Last updated
Was this helpful?