Gemma 2
Exécutez efficacement les modèles Gemma 2 de Google sur les GPU Clore.ai
Location sur CLORE.AI
Accédez à votre serveur
Qu'est-ce que Gemma 2 ?
Variantes de modèle
Modèle
Paramètres
VRAM
Contexte
Déploiement rapide
Accéder à votre service
Utilisation d'Ollama
Installation
Utilisation de base
Gemma 2 2B (Léger)
Gemma 2 27B (Meilleure qualité)
Serveur vLLM
API compatible OpenAI
Streaming
Interface Gradio
Traitement par lots
Performances
Modèle
GPU
Tokens/sec
Comparaison
Modèle
MMLU
Qualité
Vitesse
Dépannage
Génération lente
Problèmes de qualité de sortie
Avertissements du tokenizer
Estimation des coûts
GPU
Tarif horaire
Tarif journalier
Session de 4 heures
Prochaines étapes
Mis à jour
Ce contenu vous a-t-il été utile ?