Page cover

Instalación de software

Requisitos del servidor

El servidor (o equipo — estos términos son casi intercambiables en este contexto) debe estar equipado con GPU NVIDIA, ya que AMD actualmente no es compatible. El espacio en disco mínimo requerido es de 32 GB; para mayor fiabilidad, se recomienda usar un SSD en lugar de una unidad flash. Se requiere un mínimo de 8 GB de RAM, pero 16 GB proporcionarán mayor estabilidad. En cuanto a la CPU, el sistema puede funcionar con un Celeron en un socket 1151, pero para un rendimiento más eficiente, considere usar una CPU como la i7-6700.

Antes de continuar, es muy recomendable desactivar cualquier overclock, incluido el Límite de Potencia (PL), y restablecer las GPU a la configuración de fábrica. Después, pruebe el sistema bajo estrés para comprobar la estabilidad, por ejemplo, probando las GPU con el algoritmo kawpow y cargando la CPU. Controle las temperaturas y asegúrese de que todo funcione de forma estable.

Si el sistema funciona de manera estable y las temperaturas están dentro de un rango seguro, continúe con el siguiente paso de las instrucciones. Si las temperaturas son demasiado altas o se producen errores, solucione esos problemas primero —por ejemplo, mejorando la refrigeración o realizando la resolución de problemas— y asegure la operación estable antes de continuar.

Controladores y CUDA recomendados (HiveOS)

HiveOS incluye su propia gestión de controladores a través del nvidia-driver-update comando. Para la mejor compatibilidad con las cargas de trabajo de Clore.ai (especialmente ML/AI), use las siguientes versiones recomendadas:

Controladores NVIDIA

Rama
Versión
Compatibilidad con CUDA
Recomendado para

R580 (LTSB)

580.126.18

Hasta CUDA 12.8

La mayoría de las GPUs — estable, soporte a largo plazo hasta agosto de 2028

R590

590.48.01

Hasta CUDA 13.1

Serie RTX 50 (5090/5080), últimas características

Para instalar una versión específica en HiveOS:

nvidia-driver-update 580.126.18 --force

Para GPUs de la serie RTX 50:

nvidia-driver-update 590.48.01 --force

Importante: No use nvidia-driver-update --force sin especificar una versión — puede instalar un controlador predeterminado más antiguo que no sea compatible con cargas de trabajo modernas de CUDA.

Compatibilidad del Toolkit de CUDA

La mayoría de los arrendatarios usan imágenes Docker que incluyen su propio runtime de CUDA, por lo que los hosts normalmente no necesitan instalar el Toolkit de CUDA manualmente. Sin embargo, el controlador NVIDIA del host debe ser compatible con la versión de CUDA requerida por la carga de trabajo del arrendatario.

Versión de CUDA
Controlador mínimo
Estado

CUDA 12.4

R550+

Ampliamente usada en el ecosistema ML

CUDA 12.8

R570+

Última rama estable 12.x

CUDA 13.1

R590+

La más reciente, optimizada para la serie RTX 50

Recomendación: Instale R580 LTSB (580.126.18) para una amplia compatibilidad con cargas de trabajo CUDA 12.x. Si aloja GPUs de la serie RTX 50, use R590 (590.48.01) para soporte completo de CUDA 13.x.

Registro y adición del servidor

1. Vaya al sitio webarrow-up-right, regístrese, inicie sesión y navegue al mercado:

2. Agregar un servidor: Hay dos formas de agregar un servidor:

Método 1: Vaya a la sección "Mis servidores" y haga clic en el botón "+Agregar servidor". Introduzca el nombre del servidor y haga clic en "Siguiente."

Después de agregarlo, el servidor se marcará con un círculo rojo, lo que significa que está inactivo. Lo activaremos más tarde, pero por ahora, haga clic en el servidor creado para obtener una clave — la necesitará más adelante.

3. Configuración de HiveOS:

Elija el equipo y abra Shell. Para quienes usan HiveOS raramente, se han añadido imágenes abajo para mayor claridad.

4. Actualización de HiveOS: Ejecute el comando:

Si surgen problemas de espacio en disco en HiveOS: Si hay menos espacio libre en disco del esperado después de la instalación o actualización (por ejemplo, solo 20 GB libres en un disco de 512 GB), ejecute lo siguiente:

  • Para M.2:

  • Para SATA:

5. Ejecute las actualizaciones en secuencia:

6. Actualice los controladores necesarios:

Consejo: Para instalar una versión específica recomendada del controlador, use:

Para GPUs de la serie RTX 50, use la versión 590.48.01 o posterior.

7. Reinicie el equipo:

8. Cambie a modo superusuario:

9. Instale el software:

Si el sistema reporta que git falta, instálelo con:

Luego reintente la instalación.

Si encuentra un gpg error, use:

Posteriormente, vuelva a ejecutar la instalación.

10. Active el servidor:

Reemplace <token> con la clave obtenida anteriormente.

Si un error indica que falta una carpeta o archivo, es probable que la instalación no se completara correctamente y la clore-hosting carpeta no se creó. En este caso, repita la instalación.

11. Reinicio final:

Reinicie el equipo, espere un momento y actualice la página del mercado. Si todo se configuró correctamente, el servidor estará marcado con un círculo verde.

Cómo desactivar todos los servicios instalados

Si necesita desactivar todo lo instalado anteriormente:

  1. Desactive los servicios:

  2. Reinicie el sistema:

Cómo volver a habilitar los servicios

Para volver a habilitar los servicios:

  1. Habilite los servicios:

  2. Reinicie el sistema:

Eliminación del token instalado previamente

Para eliminar el token, use el comando:

El archivo que contiene el token se encuentra en:

Última actualización

¿Te fue útil?