Hardware dedicado
Clore Bare Metal — Requisitos y Guía
Clore Bare Metal son servidores físicos (no virtualizados) con acceso root completo, sin compartir y sin límites de potencia. Adecuados para IA/ML, HPC, renderizado 3D y cualquier carga de trabajo pesada.
GPUs disponibles (ejemplos): B200, H100, H200, A100, L40S, RTX 5090, RTX 4090, etc. Ubicaciones (inicio): EE. UU., Japón, Hong Kong y otras SLA: Centros de datos Tier 3 o superiores, tiempo de actividad objetivo 99.99%.
1) Qué es Bare Metal en Clore
Obtienes una máquina física completa (CPU, RAM, discos, red, GPU).
Acceso root/SSH completo y, cuando esté disponible, IPMI/KVM para reinstalación del SO.
Sin límites de PL / capas de aislamiento — el rendimiento coincide con el hardware.
Se diferencia de los alquileres basados en contenedores (HiveOS/Docker) en que los recursos no se comparten.
2) Requisitos de infraestructura obligatorios (para proveedores)
2.1 Centro de datos
Mínimo Tier 3 (Uptime Institute o un equivalente local reconocido).
Documentos: carta/certificado del DC, descripción de redundancia (energía N+1/2N, refrigeración, red).
SLA 99.99% con un NOC 24/7.
Cumplimiento con normas de seguridad contra incendios; disponibilidad de procedimientos de emergencia (RPO/RTO).
Solo entidades legales. No se aceptan “salas de servidores” en domicilios u oficinas.
2.2 Base de hardware (mínimo)
CPU: desde 64 hilos.
RAM: desde 128 GB (se recomiendan 256 GB+ para multi-GPU/HPC).
Almacenamiento: NVMe SSD ≥ 1 TB, rendimiento ≥ 1 GB/s (se recomienda RAID1/10 para sistema y datos).
Red: ≥ 1 Gbps simétrico (10 Gbps preferido, redundancia L2/L3, IPv4 estático; IPv6 es un plus).
GPU (nivel): L40S / H200 y superiores o equivalentes resistentes a cargas de trabajo intensas: B200, H100, H200, A100, L40S, RTX 4090/5090 (se prefieren tarjetas serie A para servidores y tarjetas de centro de datos).
2.3 Interconexiones de alto rendimiento (preferidas)
InfiniBand (EDR/HDR/NDR) para entrenamiento distribuido/HPC.
NVLink/NVSwitch — deseable para multi-GPU dentro de un nodo.
2.4 Confiabilidad y reemplazo
En caso de fallo de hardware — reemplazo uno por uno (configuración idéntica o estrictamente equivalente) sin degradación del SLA.
Stock obligatorio de repuestos / piezas de recambio “hot”.
2.5 Seguridad e higiene de datos
Esterilización de discos entre alquileres: blkdiscard/secure erase/1-pass zero/TRIM (registro).
Aislamiento IPMI, cerrado mgmt perímetro, ACL/perfil DDoS.
Imágenes de SO — verificadas, con microcódigos/parches actualizados, soporte para NVIDIA drivers.
3) Términos comerciales mínimos
Plazo mínimo de alquiler: desde 1 mes.
Precios: listas de precios competitivas por geolocalización (teniendo en cuenta tráfico/electricidad/IVA).
Integración API es obligatoria/deseada (dependiendo del volumen) para autoaprovisionamiento, ampliaciones y monitorización.
4) Requisitos de software e imágenes
SO: Ubuntu 22.04/24.04 LTS, Rocky/RHEL 9; bajo solicitud — Windows Server (con licencia).
Pila GPU: NVIDIA 550.xx+ (o las recomendadas para GPUs específicas), CUDA 12.2/12.4+.
Gestión: SSH (obligatorio), IPMI/KVM (preferido) con cuentas temporales para el arrendatario.
Contenerización: Docker/Podman bajo solicitud; Kubernetes — permitido si se aprovisiona un master dentro del mismo DC.
5) Cómo puede conectarse un proveedor a Bare Metal
Solicitud y verificación:
Entidad legal, contrato oficial con un DC Tier 3+, SLA 99.99%, NOC 24/7.
Paquete de documentos: certificado Tier/equivalente, SLA, seguridad contra incendios, esquema de redundancia.
Pruebas de aceptación: IPv4 pública, captura de pantalla/acceso a IPMI (KVM), resultados iPerf3/rendimiento de disco.
Catálogo SKU y precios:
Tarjetas estandarizadas (composición GPU, hilos CPU, RAM, NVMe, red, IB/NVLink, DC/ubicación, límites de tráfico).
Precios ligados a la geografía. Plazo mínimo — 2 semanas.
Políticas operativas:
Tiempo de respuesta a incidentes: ≤ 15 min; reemplazo de hardware: equivalente de inmediato.
Registro de esterilización de discos, cierre de acceso administrativo tras la devolución, auditoría.
Informes mensuales sobre tiempo de actividad/incidentes.
6) Requisitos de red y rendimiento
Mínimo 1 Gbps (simétrico), preferiblemente 10 Gbps con redundancia.
IPv4 pública, soporte rDNS bajo solicitud; IPv6 es deseable.
ACLs básicas, perfil anti-DDoS, mgmt-VLAN dedicada para IPMI.
Para InfiniBand — segmentación L2 directa dentro del rack/sala y disponibilidad de OFED.
7) Ejemplos de cargas de trabajo
Entrenamiento LLM multi-GPU: 8×L40S/NVLink o un clúster IB de nodos A100/H100/H200.
Renderizado de video: 4×RTX 4090/5090 con caché NVMe local y 10 Gbps egreso.
HFT/trading: bajas latencias, CPU 64–128 hilos, RAM 256–512 GB, NVMe RAID1 y 10 Gbps red.
Genómica/HPC: A100/H100 con IB HDR/NDR, SLURM / soporte MPI.
Comparación entre Alquiler Estándar y Bare Metal
Qué es
Contenedor/entorno dentro del SO host
Servidor físico completo
Recursos (CPU/RAM/anchura de banda)
Compartidos por el scheduler; cuotas cgroup, posible limitación
Exclusivos; CPU/RAM/anchura de banda predecibles
Root/privilegios
root dentro del contenedor, sin acceso al BIOS
Root completo del servidor; acceso BIOS/UEFI
Drivers GPU (CUDA/NVIDIA)
Versión definida por el host
Usted instala las versiones requeridas (CUDA/OFED, etc.)
Control de GPU
Passthrough con restricciones (PL/OC según la política del host)
Control completo de PL/OC; NVLink/NVSwitch (si está presente)
IPMI/KVM/Medios virtuales
No
Sí (consola remota, montaje de ISO)
Almacenamiento
Volúmenes/montajes del host; la ancho de banda puede fluctuar
NVMe/RAID directo; IOPS/rendimiento estables
Red
Puertos/NAT/anchura de banda compartida
NIC dedicada 1–10G+; rDNS, VLAN; IPv4 pública
Confiabilidad / SLA
Depende del host; no garantiza reemplazo idéntico
DC Tier 3+, SLA objetivo 99.99%, reemplazo obligatorio idéntico
Plazo mínimo
Usualmente horas/días
Desde 2 semanas
Costo
Más bajo
Más alto (exclusivo + centro de datos)
Tiempo de inicio
Segundos–minutos
desde 1 h hasta 48 h para iniciar
HPC / InfiniBand
Usualmente no
Recomendado (InfiniBand), NVLink/NVSwitch
Mejor para
Tareas rápidas, pruebas, minería, sesiones cortas
IA/ML/HPC, cargas de producción, proyectos largos
Requisitos para el proveedor
Básicos
Entidad legal, DC Tier 3+, NOC 24/7, precios regionales, API
Seguridad / datos
Dentro de las políticas del host
Esterilización de discos entre alquileres, gestión aislada (IPMI)
Preguntas frecuentes
¿En qué se diferencia Bare Metal del alquiler de contenedores? Bare Metal es completamente su máquina física (CPU/RAM/Disco/Red/GPU). En el alquiler de contenedores, los recursos se comparten y usted trabaja en un entorno aislado.
¿Es obligatorio IPMI? Preferible. Acelera la reinstalación del SO y proporciona acceso KVM, especialmente para problemas de red/SSH.
¿Se pueden interconectar nodos por IB? Sí, se fomenta InfiniBand para entrenamiento distribuido/HPC. Especifique el ancho de banda/tipo de IB en el SKU.
¿Cuál es el mínimo para GPUs? Nivel L40S / H200 y superiores, o un equivalente resistente a cargas de trabajo intensas (B200, H100, A100, etc.).
¿Qué pasa si el servidor “cae”? El proveedor debe entregar con prontitud un reemplazo idéntico sin degradación (SLA 99.99%).
Última actualización
¿Te fue útil?