Aphrodite Engine
Запустите Aphrodite Engine для инференса LLM на устаревших и современных GPU на Clore.ai
Требования к серверу
Параметр
Минимум
Рекомендуется
Быстрое развертывание на CLORE.AI
Переменная
Пример
Описание
Пошаговая настройка
1. Арендуйте GPU-сервер на CLORE.AI
2. Подключитесь по SSH
3. Загрузите образ Aphrodite Engine
4. Запустите Aphrodite Engine
5. Проверьте сервер
6. Доступ через HTTP‑прокси CLORE.AI
Примеры использования
Пример 1: Chat, совместимый с OpenAI
Пример 2: Продвинутый сэмплинг с Mirostat
Пример 3: API, совместимое с Kobold
Пример 4: Python-клиент с пользовательскими сэмплерами
Пример 5: Пакетные (batch) дописки
Конфигурация
Ключевые параметры запуска
Параметр
По умолчанию
Описание
Добавление аутентификации по API-ключу
Загрузка локальных моделей
Советы по производительности
1. Выберите подходящее квантование для вашего GPU
VRAM GPU
Модель 7B
Модель 13B
Модель 30B
2. Настройте использование видеопамяти GPU
3. Используйте bfloat16 на GPU Ampere+
4. Оптимизация для ролевых игр/творческого письма
5. Советы для Pascal GPU (GTX 10xx)
Устранение неполадок
Проблема: "CUDA capability sm_6x not supported"
Проблема: "out of memory" на маленьких GPU
Проблема: Медленная генерация токенов
Проблема: Модель не найдена / ошибки 404
Проблема: Повторяющийся вывод
Проблема: Docker-контейнер завершается без вывода
Ссылки
Рекомендации Clore.ai по GPU
Сценарий использования
Рекомендуемый GPU
Примерная стоимость на Clore.ai
Последнее обновление
Это было полезно?