Дополнительно
Clore Bare Metal — Требования и Руководство
Clore Bare Metal физические (невиртуализированные) серверы с полным root-доступом, без шаринга и без ограничений мощности. Подходят для AI/ML, HPC, 3D-рендеринга и любых тяжёлых нагрузок.
Доступные GPU (примеры): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090 и т.д. Локации (старт): США, Япония, Гонконг и другие SLA: ЦОД уровня Tier 3 и выше, целевая доступность 99.99%.
1) Что такое Bare Metal на Clore
Вы получаете целую физическую машину (CPU, RAM, диски, сеть, GPU).
Полный root-доступ/SSH и, при наличии, IPMI/KVM для переустановки ОС.
Отсутствие ограничений PL / слоёв изоляции — производительность соответствует оборудованию.
Отличается от аренды на основе контейнеров (HiveOS/Docker) тем, что ресурсы не разделяются.
2) Обязательные требования к инфраструктуре (для провайдеров)
2.1 Дата-центр
Минимум Уровень 3 (Uptime Institute или признимый местный эквивалент).
Документы: письмо/сертификат ЦОД, описание резервирования (питание N+1/2N, охлаждение, сеть).
SLA 99.99% с круглосуточным NOC.
Соответствие стандартам пожарной безопасности; наличие аварийных процедур (RPO/RTO).
Только юридические лица. Домашние/офисные «серверные» не принимаются.
2.2 Аппаратная база (минимум)
CPU: от 64 потоков.
ОЗУ: от 128 ГБ (рекомендуется 256 ГБ+ для мульти-GPU/HPC).
Хранилище: NVMe SSD ≥ 1 ТБ, пропускная способность ≥ 1 ГБ/с (рекомендуется RAID1/10 для системы и данных).
Сеть: ≥ 1 Гбит/с симметрично (предпочтительно 10 Гбит/с, резервирование L2/L3, статический IPv4; IPv6 — плюс).
GPU (уровень): L40S / H200 и выше или эквиваленты, устойчивые к тяжёлым нагрузкам: B200, H100, H200, A100, L40S, RTX 4090/5090 (предпочтительны серверные A-series и дата-центровые карты).
2.3 Высокопроизводительные интерконнекты (предпочтительно)
InfiniBand (EDR/HDR/NDR) для распределённого обучения/HPC.
NVLink/NVSwitch — желательны для мульти-GPU внутри ноды.
2.4 Надёжность и замена
В случае сбоя оборудования — замена один к одному (идентичная или строго эквивалентная конфигурация) без ухудшения SLA.
Обязательный запас запчастей / «горячие» резервы.
2.5 Безопасность и гигиена данных
Стерилизация дисков между арендами: blkdiscard/secure erase/1-pass zero/TRIM (логирование).
Изоляция IPMI, закрытая управляющая периметр, ACL/DDoS профиль.
Образы ОС — проверенные, с актуальными микрокодами/патчами, поддержкой NVIDIA драйверов.
3) Минимальные коммерческие условия
Минимальный срок аренды: от 1 месяц.
Ценообразование: прайс-листы конкурентны по геолокации (с учётом трафика/электроэнергии/НДС).
Интеграция через API обязательна/желательна (в зависимости от объёмов) для авто-провиженинга, продлений и мониторинга.
4) Требования к ПО и образам
ОС: Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9; по запросу — Windows Server (с лицензированием).
GPU-стек: NVIDIA 550.xx+ (или версии, рекомендованные для конкретных GPU), CUDA 12.2/12.4+.
Управление: SSH (обязательно), IPMI/KVM (предпочтительно) с временными учётными записями для арендатора.
Контейнеризация: Docker/Podman по запросу; Kubernetes — разрешён при развёртывании мастера в том же ЦОДе.
5) Как провайдер может подключиться к Bare Metal
Заявка и верификация:
Юридическое лицо, официальный контракт с ЦОД Tier 3+, SLA 99.99%, круглосуточный NOC.
Пакет документов: сертификат Tier/эквивалента, SLA, пожарная безопасность, схема резервирования.
Приёмочные тесты: публичный IPv4, скриншот/доступ к IPMI (KVM), результаты iPerf3/производительности диска.
Каталог SKU и ценообразование:
Стандартизованные карточки (состав GPU, потоки CPU, RAM, NVMe, сеть, IB/NVLink, ЦОД/локация, лимиты трафика).
Цены привязаны к географии. Минимальный срок — 2 недели.
Операционные политики:
Время реакции на инцидент: ≤ 15 мин; замена оборудования: эквивалентная немедленно.
Логирование стерилизации дисков, закрытие доступа админа после возврата, аудит.
Ежемесячные отчёты по времени работы/инцидентам.
6) Требования к сети и пропускной способности
Минимум 1 Гбит/с (симметрично), предпочтительно 10 Гбит/с с резервированием.
Публичный IPv4, поддержка rDNS по запросу; IPv6 желателен.
Базовые ACL, anti-DDoS профиль, выделенный mgmt-VLAN для IPMI.
Для InfiniBand — прямое L2-сегментирование внутри стойки/комнаты и доступность OFED.
7) Примеры рабочих нагрузок
Тренировка LLM на нескольких GPU: 8×L40S/NVLink или кластер IB из узлов A100/H100/H200.
Видеорендеринг: 4×RTX 4090/5090 с локальным NVMe-кэшом и 10 Гбит/с выходящим трафиком.
HFT/трейдинг: низкие задержки, CPU 64–128 потоков, ОЗУ 256–512 ГБ, NVMe RAID1 и 10 Гбит/с сеть.
Геномика/HPC: A100/H100 с IB HDR/NDR, SLURM / поддержкой MPI.
Сравнение стандартной аренды и Bare Metal
Что это такое
Контейнер/окружение внутри хост-ОС
Целый физический сервер
Ресурсы (CPU/RAM/пропускная способность)
Разделяются планировщиком; квоты cgroup, возможное троттлирование
Эксклюзивные; предсказуемые CPU/RAM/пропускная способность
Root/привилегии
root внутри контейнера, доступа к BIOS нет
Полный root сервера; доступ к BIOS/UEFI
Драйверы GPU (CUDA/NVIDIA)
Версия задаётся хостом
Вы устанавливаете требуемые версии (CUDA/OFED и т.д.)
Управление GPU
Passthrough с ограничениями (PL/OC по политике хоста)
Полный контроль PL/OC; NVLink/NVSwitch (если есть)
IPMI/KVM/Virtual Media
Нет
Да (удалённая консоль, монтирование ISO)
Хранилище
Тома/маунты хоста; пропускная способность может меняться
Прямые NVMe/RAID; стабильные IOPS/пропускная способность
Сеть
Порты/NAT/общая пропускная способность
Выделенная NIC 1–10G+; rDNS, VLAN; публичный IPv4
Надёжность / SLA
Зависит от хоста; нет гарантированной замены один к одному
ЦОД Tier 3+, целевое SLA 99.99%, обязательная замена один к одному
Минимальный срок
Обычно часы/дни
От 2 недель
Стоимость
Ниже
Выше (эксклюзивно + дата-центр)
Время запуска
Секунды–минуты
от 1 ч до 48 ч на запуск
HPC / InfiniBand
Обычно нет
Рекомендуется (InfiniBand), NVLink/NVSwitch
Лучше всего подходит для
Быстрые задачи, тесты, майнинг, короткие сессии
AI/ML/HPC, продакшен- нагрузки, долгие проекты
Требования к провайдеру
Базовые
Юридическое лицо, ЦОД Tier 3+, круглосуточный NOC, региональное ценообразование, API
Безопасность / данные
В рамках политик хоста
Санитизация дисков между арендами, изолированное управление (IPMI)
ЧаВо
Чем Bare Metal отличается от аренды контейнера? Bare Metal — это полностью ваша физическая машина (CPU/RAM/Диск/Сеть/GPU). При аренде контейнера ресурсы разделяются и вы работаете в изолированном окружении.
Требуется ли IPMI? Предпочтительно. Это ускоряет переустановку ОС и даёт доступ KVM, особенно при проблемах с сетью/SSH.
Можно ли соединять узлы по IB? Да, InfiniBand приветствуется для распределённого обучения/HPC. Укажите пропускную способность/тип IB в SKU.
Каковы минимальные требования к GPU? Уровень L40S / H200 и выше, или эквивалент, устойчивый к тяжёлым нагрузкам (B200, H100, A100 и т.д.).
Что если сервер «упал»? Провайдер должен незамедлительно предоставить идентичную замену без ухудшения (SLA 99.99%).
Последнее обновление
Это было полезно?