Mistral.rs
Что такое Mistral.rs?
Ключевые возможности
Поддерживаемые семейства моделей
Семейство
Формат
Движок
Быстрый старт на Clore.ai
Шаг 1: Найдите GPU-сервер
Шаг 2: Разверните Mistral.rs в Docker
Порт контейнера
Назначение
Шаг 3: Подключение и проверка
Запуск сервера
Быстрый старт с моделью GGUF
Запустить Mistral 7B (SafeTensors)
Запуск с In-Situ Quantization (ISQ)
Модель зрения и языка
Спекулятивная декодировка
Использование API
Конечные точки, совместимые с OpenAI
Конечная точка
Метод
Описание
Пример на Python
Потоковый ответ
Ввод изображения/зрения
Примеры cURL
Параметры конфигурации
Флаги сервера
Справочник по ISQ квантизации
Опция ISQ
Биты
Качество
VRAM (7B)
Расширенные возможности
X-LoRA (смесь адаптеров LoRA)
Повторная квантизация во время выполнения
Логирование запросов
Настройка производительности
Оптимизация пропускной способности
Оптимизация для низкой задержки
Мониторинг производительности
Docker Compose
Сборка из исходников
Устранение неполадок
Библиотека CUDA не найдена
Сбой загрузки модели
Порт 8080 занят
Недостаточно памяти при квантизации
Рекомендации Clore.ai по GPU
GPU
VRAM
Цена Clore.ai
Рекомендуемое использование
Пропускная способность (Mistral 7B Q4)
Ресурсы
Последнее обновление
Это было полезно?