# Сравнение GPU

Полное сравнение GPU, доступных на CLORE.AI для задач ИИ.

{% hint style="success" %}
Найдите подходящую GPU для вашей задачи на [Рынок CLORE.AI](https://clore.ai/marketplace).
{% endhint %}

## Быстрая рекомендация

| Ваша задача                    | Выбор по бюджету | Лучшее соотношение цены и качества | Максимальная производительность |
| ------------------------------ | ---------------- | ---------------------------------- | ------------------------------- |
| Чат с ИИ (7B)                  | RTX 3060 12GB    | RTX 3090 24GB                      | RTX 5090 32GB                   |
| Чат с ИИ (70B)                 | RTX 3090 24GB    | RTX 5090 32GB                      | A100 80GB                       |
| Генерация изображений (SD 1.5) | RTX 3060 12GB    | RTX 3090 24GB                      | RTX 5090 32GB                   |
| Генерация изображений (SDXL)   | RTX 3090 24GB    | RTX 4090 24GB                      | RTX 5090 32GB                   |
| Генерация изображений (FLUX)   | RTX 3090 24GB    | RTX 5090 32GB                      | A100 80GB                       |
| Генерация видео                | RTX 4090 24GB    | RTX 5090 32GB                      | A100 80GB                       |
| Обучение моделей               | A100 40GB        | A100 80GB                          | H100 80GB                       |

## Потребительские GPU

### NVIDIA RTX 3060 12GB

**Лучше всего для:** Бюджетный ИИ, SD 1.5, маленькие LLM

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 12 ГБ GDDR6         |
| Ширина памяти           | 360 ГБ/с            |
| Производительность FP16 | 12.7 TFLOPS         |
| Тензорные ядра          | 112 (3-е поколение) |
| TDP                     | 170 Вт              |
| \~Цена/час              | $0.02-0.04          |

**Возможности:**

* ✅ Ollama с моделями 7B (Q4)
* ✅ Stable Diffusion 1.5 (512x512)
* ✅ SDXL (768x768, медленно)
* ⚠️ FLUX schnell (с выгрузкой на CPU)
* ❌ Большие модели (>13B)
* ❌ Генерация видео

***

### NVIDIA RTX 3070/3070 Ti 8GB

**Лучше всего для:** SD 1.5, легкие задачи

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 8 ГБ GDDR6X         |
| Ширина памяти           | 448-608 ГБ/с        |
| Производительность FP16 | 20.3 TFLOPS         |
| Тензорные ядра          | 184 (3-е поколение) |
| TDP                     | 220-290 Вт          |
| \~Цена/час              | $0.02-0.04          |

**Возможности:**

* ✅ Ollama с моделями 7B (Q4)
* ✅ Stable Diffusion 1.5 (512x512)
* ⚠️ SDXL (только низкое разрешение)
* ❌ FLUX (недостаточно VRAM)
* ❌ Модели >7B
* ❌ Генерация видео

***

### NVIDIA RTX 3080/3080 Ti 10-12GB

**Лучше всего для:** Общие задачи ИИ, хороший баланс

| Характеристики          | Ценность                |
| ----------------------- | ----------------------- |
| VRAM                    | 10-12 ГБ GDDR6X         |
| Ширина памяти           | 760-912 ГБ/с            |
| Производительность FP16 | 29.8-34.1 TFLOPS        |
| Тензорные ядра          | 272-320 (3-е поколение) |
| TDP                     | 320-350 Вт              |
| \~Цена/час              | $0.04-0.06              |

**Возможности:**

* ✅ Ollama с моделями 13B
* ✅ Stable Diffusion 1.5/2.1
* ✅ SDXL (1024x1024)
* ⚠️ FLUX schnell (с выгрузкой)
* ❌ Большие модели (>13B)
* ❌ Генерация видео

***

### NVIDIA RTX 3090/3090 Ti 24GB

**Лучше всего для:** SDXL, LLM 13B-30B, ControlNet

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 24 ГБ GDDR6X        |
| Ширина памяти           | 936 ГБ/с            |
| Производительность FP16 | 35.6 TFLOPS         |
| Тензорные ядра          | 328 (3-е поколение) |
| TDP                     | 350-450 Вт          |
| \~Цена/час              | $0.05-0.08          |

**Возможности:**

* ✅ Ollama с моделями 30B
* ✅ vLLM с моделями 13B
* ✅ Все модели Stable Diffusion
* ✅ SDXL + ControlNet
* ✅ FLUX schnell (1024x1024)
* ⚠️ FLUX dev (с выгрузкой)
* ⚠️ Видео (короткие клипы)

***

### NVIDIA RTX 4070 Ti 12GB

**Лучше всего для:** Быстрая SD 1.5, эффективный вывод

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 12 ГБ GDDR6X        |
| Ширина памяти           | 504 ГБ/с            |
| Производительность FP16 | 40.1 TFLOPS         |
| Тензорные ядра          | 184 (4-е поколение) |
| TDP                     | 285 Вт              |
| \~Цена/час              | $0.04-0.06          |

**Возможности:**

* ✅ Ollama с моделями 7B (быстро)
* ✅ Stable Diffusion 1.5 (очень быстро)
* ✅ SDXL (768x768)
* ⚠️ FLUX schnell (ограниченное разрешение)
* ❌ Большие модели (>13B)
* ❌ Генерация видео

***

### NVIDIA RTX 4080 16GB

**Лучше всего для:** SDXL в продакшне, LLM 13B

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 16 ГБ GDDR6X        |
| Ширина памяти           | 717 ГБ/с            |
| Производительность FP16 | 48.7 TFLOPS         |
| Тензорные ядра          | 304 (4-е поколение) |
| TDP                     | 320 Вт              |
| \~Цена/час              | $0.06-0.09          |

**Возможности:**

* ✅ Ollama с моделями 13B (быстро)
* ✅ vLLM с моделями 7B
* ✅ Все модели Stable Diffusion
* ✅ SDXL + ControlNet
* ✅ FLUX schnell (1024x1024)
* ⚠️ FLUX dev (ограничено)
* ⚠️ Короткие видеоклипы

***

### NVIDIA RTX 4090 24GB

**Лучше всего для:** Производительность высокого класса для потребителей, FLUX, видео

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 24 ГБ GDDR6X        |
| Ширина памяти           | 1008 ГБ/с           |
| Производительность FP16 | 82.6 TFLOPS         |
| Тензорные ядра          | 512 (4-е поколение) |
| TDP                     | 450 Вт              |
| \~Цена/час              | $0.08-0.12          |

**Возможности:**

* ✅ Ollama с моделями 30B (быстро)
* ✅ vLLM с моделями 13B
* ✅ Все модели генерации изображений
* ✅ FLUX dev (1024x1024)
* ✅ Генерация видео (короткие)
* ✅ AnimateDiff
* ⚠️ Модели 70B (только Q4)

***

### NVIDIA RTX 5080 16GB *(Новинка — февраль 2025)*

**Лучше всего для:** Быстрый SDXL/FLUX, LLM 13B-30B, высокопроизводительный средний класс

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 16 ГБ GDDR7         |
| Ширина памяти           | 960 ГБ/с            |
| Производительность FP16 | \~80 TFLOPS         |
| Тензорные ядра          | 336 (5-е поколение) |
| TDP                     | 360 Вт              |
| \~Цена Clore.ai/час     | $1.50-2.00          |

**Возможности:**

* ✅ Ollama с моделями 13B (быстро)
* ✅ vLLM с моделями 13B
* ✅ Все модели Stable Diffusion
* ✅ SDXL + ControlNet (очень быстро)
* ✅ FLUX schnell/dev (1024x1024)
* ✅ Короткие видеоклипы
* ⚠️ Модели 30B (только Q4)
* ❌ Модели 70B

***

### NVIDIA RTX 5090 32GB *(Флагман — февраль 2025)*

**Лучше всего для:** Максимальная потребительская производительность, модели 70B, генерация видео высокого разрешения

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 32 ГБ GDDR7         |
| Ширина памяти           | 1792 ГБ/с           |
| Производительность FP16 | \~120 TFLOPS        |
| Тензорные ядра          | 680 (5-е поколение) |
| TDP                     | 575 Вт              |
| \~Цена Clore.ai/час     | $3.00-4.00          |

**Возможности:**

* ✅ Ollama с моделями 70B (Q4, быстро)
* ✅ vLLM с моделями 30B
* ✅ Все модели генерации изображений
* ✅ FLUX dev (1536x1536)
* ✅ Генерация видео (длиннее клипы)
* ✅ AnimateDiff + ControlNet
* ✅ Обучение моделей (LoRA, небольшие дообучения)
* ✅ DeepSeek-R1 32B distill (FP16)

## Профессиональные/датацентровые GPU

### NVIDIA A100 40GB

**Лучше всего для:** Продакшн LLM, обучение, большие модели

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 40 ГБ HBM2e         |
| Ширина памяти           | 1555 ГБ/с           |
| Производительность FP16 | 77.97 TFLOPS        |
| Тензорные ядра          | 432 (3-е поколение) |
| TDP                     | 400 Вт              |
| \~Цена/час              | $0.15-0.20          |

**Возможности:**

* ✅ Ollama с моделями 70B (Q4)
* ✅ vLLM для production-сервинга
* ✅ Вся генерация изображений
* ✅ FLUX dev (высокое качество)
* ✅ Генерация видео
* ✅ Дообучение моделей
* ⚠️ 70B FP16 (впритык)

***

### NVIDIA A100 80GB

**Лучше всего для:** Модели 70B+, видео, production-нагрузки

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 80 ГБ HBM2e         |
| Ширина памяти           | 2039 ГБ/с           |
| Производительность FP16 | 77.97 TFLOPS        |
| Тензорные ядра          | 432 (3-е поколение) |
| TDP                     | 400 Вт              |
| \~Цена/час              | $0.20-0.30          |

**Возможности:**

* ✅ Все LLM до 70B (FP16)
* ✅ vLLM для высокопроизводительного сервинга
* ✅ Вся генерация изображений
* ✅ Генерация длинного видео
* ✅ Обучение моделей
* ✅ DeepSeek-V3 (частично)
* ⚠️ Модели 100B+

***

### NVIDIA H100 80GB

**Лучше всего для:** Максимальная производительность, самые большие модели

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 80 ГБ HBM3          |
| Ширина памяти           | 3350 ГБ/с           |
| Производительность FP16 | 267 TFLOPS          |
| Тензорные ядра          | 528 (4-е поколение) |
| TDP                     | 700 Вт              |
| \~Цена/час              | $0.40-0.60          |

**Возможности:**

* ✅ Все модели с максимальной скоростью
* ✅ Модели 100B+ параметров
* ✅ Сервинг нескольких моделей
* ✅ Крупномасштабное обучение
* ✅ Генерация видео в реальном времени
* ✅ DeepSeek-V3 (671B)

## Сравнение производительности

### Вывод LLM (токенов/сек)

| GPU           | Llama 3 8B | Llama 3 70B | Mixtral 8x7B | Clore.ai $/час |
| ------------- | ---------- | ----------- | ------------ | -------------- |
| RTX 3060 12GB | 25         | -           | -            | $0.02-0.04     |
| RTX 3090 24GB | 45         | 8\*         | 20\*         | $0.15-0.25     |
| RTX 4090 24GB | 80         | 15\*        | 35\*         | $0.35-0.55     |
| RTX 5080 16GB | 95         | -           | 40\*         | $1.50-2.00     |
| RTX 5090 32GB | 150        | 30\*        | 65\*         | $3.00-4.00     |
| A100 40GB     | 100        | 25          | 45           | $0.80-1.20     |
| A100 80GB     | 110        | 40          | 55           | $1.20-1.80     |
| H100 80GB     | 180        | 70          | 90           | $2.50-3.50     |

\*С квантованием (Q4/Q8)

### Скорость генерации изображений

| GPU           | SD 1.5 (512) | SDXL (1024) | FLUX schnell | Clore.ai $/час |
| ------------- | ------------ | ----------- | ------------ | -------------- |
| RTX 3060 12GB | 4 сек        | 15 сек      | 25 сек\*     | $0.02-0.04     |
| RTX 3090 24GB | 2 сек        | 7 сек       | 12 сек       | $0.15-0.25     |
| RTX 4090 24GB | 1 сек        | 3 сек       | 5 сек        | $0.35-0.55     |
| RTX 5080 16GB | 0.8 сек      | 2.5 сек     | 4 сек        | $1.50-2.00     |
| RTX 5090 32GB | 0.6 сек      | 1.8 сек     | 3 сек        | $3.00-4.00     |
| A100 40GB     | 1.5 сек      | 4 сек       | 6 сек        | $0.80-1.20     |
| A100 80GB     | 1.5 сек      | 4 сек       | 5 сек        | $1.20-1.80     |

\*С выгрузкой на CPU, более низкое разрешение

### Генерация видео (клип 5 сек)

| GPU           | SVD     | Wan2.1  | Hunyuan |
| ------------- | ------- | ------- | ------- |
| RTX 3090 24GB | 3 мин   | 5 мин\* | -       |
| RTX 4090 24GB | 1.5 мин | 3 мин   | 8 мин\* |
| RTX 5090 32GB | 1 мин   | 2 мин   | 5 мин   |
| A100 40GB     | 1 мин   | 2 мин   | 5 мин   |
| A100 80GB     | 45 сек  | 1.5 мин | 3 мин   |

\*Ограниченное разрешение

## Соотношение цена/производительность

### Лучшее значение по задаче

**Чат/LLM (модели 7B-13B):**

1. 🥇 RTX 3090 24GB - Лучшее соотношение цена/производительность
2. 🥈 RTX 3060 12GB - Самая низкая стоимость
3. 🥉 RTX 4090 24GB - Самая быстрая

**Генерация изображений (SDXL/FLUX):**

1. 🥇 RTX 3090 24GB - Отличный баланс
2. 🥈 RTX 4090 24GB - В 2 раза быстрее
3. 🥉 A100 40GB - Стабильность для продакшна

**Большие модели (70B+):**

1. 🥇 A100 40GB - Лучшее соотношение для 70B
2. 🥈 A100 80GB - Полная точность
3. 🥉 RTX 4090 24GB - Бюджетный вариант (только Q4)

**Генерация видео:**

1. 🥇 A100 40GB - Хороший баланс
2. 🥈 RTX 4090 24GB - Потребительский вариант
3. 🥉 A100 80GB - Для самых длинных клипов

**Обучение моделей:**

1. 🥇 A100 40GB - Стандартный выбор
2. 🥈 A100 80GB - Для больших моделей
3. 🥉 RTX 4090 24GB - Малые модели/LoRA

## Мульти-GPU конфигурации

Некоторым задачам полезно использовать несколько GPU:

| Конфигурация | Сценарий использования     | Общий VRAM |
| ------------ | -------------------------- | ---------- |
| 2x RTX 3090  | Инференс 70B               | 48 ГБ      |
| 2x RTX 4090  | Быстрый 70B, обучение      | 48 ГБ      |
| 2x RTX 5090  | 70B FP16, быстрое обучение | 64 ГБ      |
| 4x RTX 5090  | Модели 100B+               | 128 ГБ     |
| 4x A100 40GB | Модели 100B+               | 160 ГБ     |
| 8x A100 80GB | DeepSeek-V3, Llama 405B    | 640 ГБ     |

## Выбор вашей GPU

### Блок-схема принятия решения

```
Какая у вас основная задача?
│
├─ Чат/LLM
│  ├─ Размер модели?
│  │  ├─ ≤7B → RTX 3060 ($0.15–0.30/день)
│  │  ├─ 7B-30B → RTX 3090 ($0.30–1.00/день)
│  │  ├─ 30B-70B → A100 40GB ($1.50–3.00/день)
│  │  └─ 70B+ → A100 80GB ($2.00–4.00/день)
│
├─ Генерация изображений
│  ├─ Модель?
│  │  ├─ SD 1.5 → RTX 3060 ($0.15–0.30/день)
│  │  ├─ SDXL → RTX 3090 ($0.30–1.00/день)
│  │  └─ FLUX → RTX 4090 ($0.50–2.00/день)
│
├─ Генерация видео
│  ├─ Длина?
│  │  ├─ Короткое (2-5 сек) → RTX 4090 ($0.50–2.00/день)
│  │  └─ Длиннее → A100 40GB+ ($1.50–3.00+/день)
│
└─ Обучение
   ├─ LoRA/малое → RTX 4090 ($0.50–2.00/день)
   └─ Полное дообучение → A100 40GB+ ($1.50–3.00+/день)
```

## Советы по экономии денег

1. **Используйте Spot-заказы** - На 30–50% дешевле, чем по запросу
2. **Начните с малого** - Сначала тестируйте на более дешевых GPU
3. **Квантование моделей** - Q4/Q8 позволяет уместить большие модели в меньше VRAM
4. **Пакетная обработка** - Обрабатывайте несколько запросов за раз
5. **Внепиковые часы** - Лучшая доступность и иногда более низкие цены

> 📚 Смотрите также: [Топ-10 самых дешевых GPU для обучения ИИ в 2025 году](https://blog.clore.ai/top-10-cheapest-gpus-for-ai-training/) | [Лучшая GPU для обучения ИИ — подробное руководство](https://blog.clore.ai/best-gpu-for-ai-training/)

## Следующие шаги

* [Матрица совместимости моделей](https://docs.clore.ai/guides/guides_v2-ru/nachalo-raboty/model-compatibility) - Какие модели запускаются на каких GPU
* [Каталог Docker-образов](https://docs.clore.ai/guides/guides_v2-ru/nachalo-raboty/docker-images) - Готовые к использованию образы
* [Руководство по быстрому старту](https://docs.clore.ai/guides/guides_v2-ru/quickstart) - Начните за 5 минут
