Aphrodite Engine
Ejecuta Aphrodite Engine para inferencia de LLMs en GPU antiguas y modernas en Clore.ai
Requisitos del servidor
Parámetro
Mínimo
Recomendado
Despliegue rápido en CLORE.AI
Variable
Ejemplo
Descripción
Configuración paso a paso
1. Alquila un servidor GPU en CLORE.AI
2. Conéctate vía SSH
3. Descargar la imagen de Aphrodite Engine
4. Lanzar Aphrodite Engine
5. Verifique el Servidor
6. Acceso vía Proxy HTTP de CLORE.AI
Ejemplos de uso
Ejemplo 1: Chat compatible con OpenAI
Ejemplo 2: Muestreo avanzado con Mirostat
Ejemplo 3: API compatible con Kobold
Ejemplo 4: Cliente Python con muestreadores personalizados
Ejemplo 5: Completaciones por lotes
Configuración
Parámetros clave de lanzamiento
Parámetro
Por defecto
Descripción
Añadiendo autenticación por clave API
Cargando modelos locales
Consejos de rendimiento
1. Elige la cuantización adecuada para tu GPU
VRAM GPU
Modelo 7B
Modelo 13B
Modelo 30B
2. Ajusta la utilización de memoria GPU
3. Usar bfloat16 en GPUs Ampere+
4. Optimizar para roleplay/escritura creativa
5. Consejos para GPU Pascal (GTX 10xx)
Solución de problemas
Problema: "CUDA capability sm_6x not supported"
Problema: "fuera de memoria" en GPUs pequeñas
Problema: Generación de tokens lenta
Problema: Modelo no encontrado / errores 404
Problema: Salida repetitiva
Problema: El contenedor Docker sale silenciosamente
Enlaces
Recomendaciones de GPU en Clore.ai
Caso de uso
GPU recomendada
Coste estimado en Clore.ai
Última actualización
¿Te fue útil?