Mistral Small 3.1
Despliega Mistral Small 3.1 (24B) en Clore.ai — el modelo de producción ideal para una sola GPU
Características clave
Requisitos
Componente
Cuantizado (Q4)
Precisión completa (BF16)
Inicio rápido con Ollama
Ollama como API compatible con OpenAI
Ollama con Visión
Configuración de vLLM (Producción)
Servir en GPU única (solo texto)
Servir con Visión (se recomiendan 2 GPUs)
Consultar el servidor
HuggingFace Transformers
Ejemplo de llamadas a funciones
Inicio rápido con Docker
Consejos para usuarios de Clore.ai
Solución de problemas
Problema
Solución
Lecturas adicionales
Última actualización
¿Te fue útil?