Gemma 2
Ejecuta los modelos Gemma 2 de Google de forma eficiente en GPUs de Clore.ai
Alquilar en CLORE.AI
Accede a tu servidor
¿Qué es Gemma 2?
Variantes de modelo
Modelo
Parámetros
VRAM
Contexto
Despliegue rápido
Accediendo a tu servicio
Usando Ollama
Instalación
Uso básico
Gemma 2 2B (Ligero)
Gemma 2 27B (Mejor calidad)
Servidor vLLM
API compatible con OpenAI
Streaming
Interfaz Gradio
Procesamiento por lotes
Rendimiento
Modelo
GPU
Tokens/seg
Comparación
Modelo
MMLU
Calidad
Velocidad
Solución de problemas
Generación lenta
Problemas de calidad de salida
Advertencias del tokenizador
Estimación de costos
GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas
Próximos pasos
Última actualización
¿Te fue útil?