Llama 4 (Scout y Maverick)
Ejecuta los modelos MoE Meta Llama 4 Scout & Maverick en GPUs de Clore.ai
Características clave
Variantes de modelo
Modelo
Parámetros totales
Parámetros activos
Expertos
Contexto
VRAM mínima (Q4)
VRAM mínima (FP16)
Requisitos
Componente
Scout (Q4)
Scout (FP16)
Maverick (Q4)
Inicio rápido con Ollama
Ollama como servidor API
Configuración de vLLM (Producción)
Consultar el servidor vLLM
HuggingFace Transformers
Inicio rápido con Docker
Por qué MoE importa en Clore.ai
Consejos para usuarios de Clore.ai
Solución de problemas
Problema
Solución
Lecturas adicionales
Última actualización
¿Te fue útil?