Совместимость моделей
Матрица совместимости моделей ИИ и GPU для Clore.ai
Быстрая справка
Языковые модели (LLM)
Модель
Параметры
Мин. VRAM
Рекомендуется
Квантование
Модели генерации изображений
Модель
Мин. VRAM
Рекомендуется
Примечания
Модели генерации видео
Модель
Мин. VRAM
Рекомендуется
Выход
Аудио-модели
Модель
Мин. VRAM
Рекомендуется
Задача
Визуальные и мульти-модальные модели
Модель
Мин. VRAM
Рекомендуется
Задача
Инструменты дообучения и тренировки
Инструмент / Метод
Мин. VRAM
Рекомендуемый GPU
Задача
Подробные таблицы совместимости
LLM по GPU
GPU
Макс. модель (Q4)
Макс. модель (Q8)
Макс. модель (FP16)
Генерация изображений по GPU
GPU
SD 1.5
SDXL
FLUX schnell
FLUX dev
Генерация видео по GPU
GPU
SVD
AnimateDiff
Wan2.1
Hunyuan
Руководство по квантованию
Что такое квантование?
Формат
Биты
Снижение VRAM
Потеря качества
Калькулятор VRAM
Размер модели
FP16
Q8
Q4
Рекомендуемое квантование по сценариям использования
Случай использования
Рекомендуется
Почему
Длина контекста vs VRAM
Как контекст влияет на VRAM
Модель
Контекст по умолчанию
Макс. контекст
VRAM на 1К токенов
Контекст по GPU (Llama 3 8B Q4)
GPU
Комфортный контекст
Максимальный контекст
Конфигурации с несколькими GPU
Тензорный параллелизм
Конфигурация
Общий VRAM
Макс. модель (FP16)
vLLM Multi-GPU
Руководства по конкретным моделям
Семейство Llama 3.1
Вариант
Параметры
Мин. GPU
Рекомендуемая конфигурация
Семейство Mistral/Mixtral
Вариант
Параметры
Мин. GPU
Рекомендуемая конфигурация
Семейство Qwen 2.5
Вариант
Параметры
Мин. GPU
Рекомендуемая конфигурация
Модели DeepSeek
Вариант
Параметры
Мин. GPU
Рекомендуемая конфигурация
Устранение неполадок
"CUDA out of memory"
"Модель слишком большая"
"Медленная генерация"
Дальнейшие шаги
Последнее обновление
Это было полезно?