Оффлайн-ассистент Jan.ai
Разверните сервер Jan.ai на Clore.ai — полностью оффлайн-совместимый с OpenAI сервер LLM с хабом моделей, управлением разговоров и ускорённым на GPU инференсом на движке Cortex.
Обзор
Требования
Требования к аппаратному обеспечению
Тариф
GPU
VRAM
ОЗУ
Хранилище
Clore.ai Цена
Справка по VRAM моделей
Модель
Требуемая VRAM
Рекомендуемый GPU
Программные предпосылки
Быстрый старт
Шаг 1 — Арендуйте сервер с GPU на Clore.ai
Шаг 2 — Подключитесь к вашему серверу
Шаг 3 — Установите Docker Compose (если отсутствует)
Шаг 4 — Разверните Jan Server с помощью Docker Compose
Шаг 5 — Проверьте, что сервер работает
Шаг 6 — Загрузите вашу первую модель
Шаг 7 — Запустите модель и начните чат
Конфигурация
Переменные окружения
Переменная
По умолчанию
Описание
Конфигурация с несколькими GPU
Пользовательская конфигурация модели
Защита API с помощью токена
Ускорение с помощью GPU
Проверка ускорения CUDA
Переключение бэкендов вывода
Настройка окна контекста и размера батча
Параметр
Описание
Рекомендация
Подсказки и лучшие практики
🎯 Выбор моделей для бюджетов Clore.ai
💾 Постоянное хранилище моделей
🔗 Использование Jan Server как замены OpenAI
📊 Мониторинг использования ресурсов
Устранение неполадок
Контейнер не запускается — GPU не найден
Загрузка модели зависла или не удалась
Закончилась VRAM (CUDA out of memory)
Не удаётся подключиться к API из вне контейнера
Медленный вывод (переход на CPU)
Дополнительное чтение
Последнее обновление
Это было полезно?