Text Generation WebUI
Ejecuta text-generation-webui para inferencia LLM en GPUs de Clore.ai
Alquilar en CLORE.AI
Accede a tu servidor
¿Por qué Text Generation WebUI?
Requisitos
Tamaño del modelo
VRAM mínima
Recomendado
Despliegue rápido
Instalación manual
Accediendo a tu servicio
Acceder a WebUI
Descargar modelos
Desde HuggingFace (en WebUI)
Vía línea de comandos
Modelos recomendados
Cargando modelos
GGUF (Recomendado para la mayoría de los usuarios)
GPTQ (rápido, cuantizado)
EXL2 (Mejor velocidad)
Configuración de chat
Configuración de personaje
Modo Instruct
Uso de la API
Habilitar API
API compatible con OpenAI
API nativa
Extensiones
Instalando extensiones
Habilitar extensiones
Extensiones populares
Extensión
Propósito
Ajuste de rendimiento
Configuración GGUF
Optimización de memoria
Optimización de velocidad
Ajuste fino (LoRA)
Pestaña de entrenamiento
Formato del conjunto de datos
Guardando tu trabajo
Solución de problemas
El modelo no se carga
Generación lenta
Estimación de costos
GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas
Última actualización
¿Te fue útil?