Llama 4 (Scout & Maverick)
Exécutez les modèles MoE Meta Llama 4 Scout & Maverick sur les GPU Clore.ai
Principales caractéristiques
Variantes de modèle
Modèle
Paramètres totaux
Paramètres actifs
Experts
Contexte
VRAM minimale (Q4)
VRAM minimale (FP16)
Exigences
Composant
Scout (Q4)
Scout (FP16)
Maverick (Q4)
Démarrage rapide avec Ollama
Ollama en tant que serveur API
Configuration vLLM (Production)
Interroger le serveur vLLM
HuggingFace Transformers
Démarrage rapide Docker
Pourquoi MoE est important sur Clore.ai
Conseils pour les utilisateurs de Clore.ai
Dépannage
Problème
Solution
Lectures complémentaires
Mis à jour
Ce contenu vous a-t-il été utile ?