Gemma 2
Эффективно запускайте модели Google Gemma 2 на GPU Clore.ai
Аренда на CLORE.AI
Доступ к вашему серверу
Что такое Gemma 2?
Варианты моделей
Модель
Параметры
VRAM
Контекст
Быстрое развертывание
Доступ к вашему сервису
Использование Ollama
Установка
Базовое использование
Gemma 2 2B (Лёгкая)
Gemma 2 27B (Лучшее качество)
vLLM Сервер
Совместимый с OpenAI API
Потоковая передача (Streaming)
Интерфейс Gradio
Пакетная обработка
Производительность
Модель
GPU
Токенов/с
Сравнение
Модель
MMLU
Качество
Скорость
Устранение неполадок
Медленная генерация
Проблемы с качеством вывода
Предупреждения токенизатора
Оценка стоимости
GPU
Почасовая ставка
Дневная ставка
Сессия 4 часа
Дальнейшие шаги
Последнее обновление
Это было полезно?