Page cover

Instalación de software

Requisitos del servidor

El servidor (o equipo: estos términos son casi intercambiables en este contexto) debe estar equipado con GPUs NVIDIA, ya que AMD actualmente no es compatible. El espacio mínimo requerido en disco es de 32 GB; para mayor fiabilidad se recomienda usar un SSD en lugar de una memoria flash. Se requiere un mínimo de 8 GB de RAM, pero 16 GB brindarán mayor estabilidad. En cuanto a la CPU, el sistema puede funcionar con un Celeron en un socket 1151, pero para un rendimiento más eficiente considere usar una CPU como la i7-6700.

Antes de continuar, se recomienda encarecidamente desactivar cualquier overclocking, incluido el Límite de Potencia (PL), y restablecer las GPUs a la configuración de fábrica. Después, sometan el sistema a una prueba de esfuerzo para comprobar la estabilidad, por ejemplo, probando las GPUs con el algoritmo kawpow y cargando la CPU. Monitorice las temperaturas y asegúrese de que todo funcione de forma estable.

Si el sistema funciona de forma estable y las temperaturas están dentro de un rango seguro, continúe con el siguiente paso de las instrucciones. Si las temperaturas son demasiado altas o se producen errores, solucione esos problemas primero —por ejemplo, mejorando la refrigeración o depurando— y asegure el funcionamiento estable antes de continuar.

Controladores y CUDA recomendados (HiveOS)

HiveOS incluye su propia gestión de controladores vía el nvidia-driver-update comando. Para la mejor compatibilidad con las cargas de trabajo de Clore.ai (especialmente ML/IA), utilice las siguientes versiones recomendadas:

Controladores NVIDIA

Rama
Versión
Compatibilidad con CUDA
Recomendado para

R580 (LTSB)

580.126.18

Hasta CUDA 12.8

La mayoría de GPUs — estable, soporte a largo plazo hasta agosto de 2028

R590

590.48.01

Hasta CUDA 13.1

Series RTX 50 (5090/5080), últimas funciones

Para instalar una versión específica en HiveOS:

nvidia-driver-update 580.126.18 --force

Para GPUs de la serie RTX 50:

nvidia-driver-update 590.48.01 --force

Importante: No use nvidia-driver-update --force sin especificar una versión — puede instalar un controlador predeterminado más antiguo que no sea compatible con cargas de trabajo CUDA modernas.

Compatibilidad del Kit de herramientas CUDA

La mayoría de los arrendatarios usan imágenes Docker que incluyen su propio runtime de CUDA, por lo que los hosts normalmente no necesitan instalar el Kit de herramientas CUDA manualmente. Sin embargo, el controlador NVIDIA del host debe soportar la versión de CUDA requerida por la carga de trabajo del arrendatario.

Versión de CUDA
Controlador mínimo
Estado

CUDA 12.4

R550+

Ampliamente utilizada en el ecosistema de ML

CUDA 12.8

R570+

Última rama estable 12.x

CUDA 13.1

R590+

Última, optimizada para la serie RTX 50

Recomendación: Instale R580 LTSB (580.126.18) para una amplia compatibilidad con cargas de trabajo CUDA 12.x. Si aloja GPUs de la serie RTX 50, use R590 (590.48.01) para soporte completo de CUDA 13.x.

Registro y adición del servidor

1. Vaya al sitio webarrow-up-right, regístrese, inicie sesión y navegue al marketplace:

2. Agregar un servidor: Hay dos formas de agregar un servidor:

Método 1: Vaya a la sección "Mis servidores" y haga clic en el botón "+Agregar servidor". Introduzca el nombre del servidor y haga clic en "Siguiente".

Después de agregarlo, el servidor aparecerá marcado con un círculo rojo, lo que significa que está inactivo. Lo activaremos más adelante, pero por ahora haga clic en el servidor creado para obtener una clave: la necesitará después.

3. Configuración de HiveOS:

Elija el equipo y abra Shell. Para quienes usan HiveOS raramente, se han añadido imágenes a continuación para mayor claridad.

4. Actualización de HiveOS: Ejecute el comando:

Si surgen problemas de espacio en disco en HiveOS: Si hay menos espacio libre en disco del esperado después de la instalación o actualización (por ejemplo, solo 20 GB libres en un disco de 512 GB), ejecute lo siguiente:

  • Para M.2:

  • Para SATA:

5. Ejecute las actualizaciones en secuencia:

6. Actualice los controladores necesarios:

Consejo: Para instalar una versión de controlador recomendada específica, use:

Para GPUs de la serie RTX 50, use la versión 590.48.01 o posterior.

7. Reinicie el equipo:

8. Cambie al modo superusuario:

9. Instale el software:

Si el sistema informa que git falta, instálelo con:

Luego vuelva a intentar la instalación.

Si encuentra un gpg error, use:

Luego, vuelva a ejecutar la instalación.

10. Active el servidor:

Reemplace <token> con la clave obtenida anteriormente.

Si un error indica que falta una carpeta o archivo, probablemente la instalación no se completó correctamente y la clore-hosting carpeta no se creó. En ese caso, repita la instalación.

11. Reinicio final:

Reinicie el equipo, espere un momento y actualice la página del marketplace. Si todo se configuró correctamente, el servidor aparecerá marcado con un círculo verde.

Cómo desactivar todos los servicios instalados

Si necesita desactivar todo lo instalado anteriormente:

  1. Desactive los servicios:

  2. Reinicie el sistema:

Cómo volver a habilitar los servicios

Para volver a habilitar los servicios:

  1. Habilite los servicios:

  2. Reinicie el sistema:

Eliminar el token instalado previamente

Para eliminar el token, use el comando:

El archivo que contiene el token se encuentra en:

Última actualización

¿Te fue útil?