> For the complete documentation index, see [llms.txt](https://docs.clore.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.clore.ai/guides/guides_v2-ru/nachalo-raboty/gpu-comparison.md).

# Сравнение GPU

Полное сравнение GPU, доступных на CLORE.AI для задач ИИ.

{% hint style="success" %}
Найдите подходящую GPU для вашей задачи на [Рынок CLORE.AI](https://clore.ai/marketplace).
{% endhint %}

## Быстрая рекомендация

| Ваша задача                    | Выбор по бюджету | Лучшее соотношение цены и качества | Максимальная производительность |
| ------------------------------ | ---------------- | ---------------------------------- | ------------------------------- |
| Чат с ИИ (7B)                  | RTX 3060 12GB    | RTX 3090 24GB                      | RTX 5090 32GB                   |
| Чат с ИИ (70B)                 | RTX 3090 24GB    | RTX 5090 32GB                      | A100 80GB                       |
| Генерация изображений (SD 1.5) | RTX 3060 12GB    | RTX 3090 24GB                      | RTX 5090 32GB                   |
| Генерация изображений (SDXL)   | RTX 3090 24GB    | RTX 4090 24GB                      | RTX 5090 32GB                   |
| Генерация изображений (FLUX)   | RTX 3090 24GB    | RTX 5090 32GB                      | A100 80GB                       |
| Генерация видео                | RTX 4090 24GB    | RTX 5090 32GB                      | A100 80GB                       |
| Обучение моделей               | A100 40GB        | A100 80GB                          | H100 80GB                       |

## Потребительские GPU

### NVIDIA RTX 3060 12GB

**Лучше всего для:** Бюджетный ИИ, SD 1.5, маленькие LLM

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 12 ГБ GDDR6         |
| Ширина памяти           | 360 ГБ/с            |
| Производительность FP16 | 12.7 TFLOPS         |
| Тензорные ядра          | 112 (3-е поколение) |
| TDP                     | 170 Вт              |
| \~Цена/час              | $0.02-0.04          |

**Возможности:**

* ✅ Ollama с моделями 7B (Q4)
* ✅ Stable Diffusion 1.5 (512x512)
* ✅ SDXL (768x768, медленно)
* ⚠️ FLUX schnell (с выгрузкой на CPU)
* ❌ Большие модели (>13B)
* ❌ Генерация видео

***

### NVIDIA RTX 3070/3070 Ti 8GB

**Лучше всего для:** SD 1.5, легкие задачи

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 8 ГБ GDDR6X         |
| Ширина памяти           | 448-608 ГБ/с        |
| Производительность FP16 | 20.3 TFLOPS         |
| Тензорные ядра          | 184 (3-е поколение) |
| TDP                     | 220-290 Вт          |
| \~Цена/час              | $0.02-0.04          |

**Возможности:**

* ✅ Ollama с моделями 7B (Q4)
* ✅ Stable Diffusion 1.5 (512x512)
* ⚠️ SDXL (только низкое разрешение)
* ❌ FLUX (недостаточно VRAM)
* ❌ Модели >7B
* ❌ Генерация видео

***

### NVIDIA RTX 3080/3080 Ti 10-12GB

**Лучше всего для:** Общие задачи ИИ, хороший баланс

| Характеристики          | Ценность                |
| ----------------------- | ----------------------- |
| VRAM                    | 10-12 ГБ GDDR6X         |
| Ширина памяти           | 760-912 ГБ/с            |
| Производительность FP16 | 29.8-34.1 TFLOPS        |
| Тензорные ядра          | 272-320 (3-е поколение) |
| TDP                     | 320-350 Вт              |
| \~Цена/час              | $0.04-0.06              |

**Возможности:**

* ✅ Ollama с моделями 13B
* ✅ Stable Diffusion 1.5/2.1
* ✅ SDXL (1024x1024)
* ⚠️ FLUX schnell (с выгрузкой)
* ❌ Большие модели (>13B)
* ❌ Генерация видео

***

### NVIDIA RTX 3090/3090 Ti 24GB

**Лучше всего для:** SDXL, LLM 13B-30B, ControlNet

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 24 ГБ GDDR6X        |
| Ширина памяти           | 936 ГБ/с            |
| Производительность FP16 | 35.6 TFLOPS         |
| Тензорные ядра          | 328 (3-е поколение) |
| TDP                     | 350-450 Вт          |
| \~Цена/час              | $0.05-0.08          |

**Возможности:**

* ✅ Ollama с моделями 30B
* ✅ vLLM с моделями 13B
* ✅ Все модели Stable Diffusion
* ✅ SDXL + ControlNet
* ✅ FLUX schnell (1024x1024)
* ⚠️ FLUX dev (с выгрузкой)
* ⚠️ Видео (короткие клипы)

***

### NVIDIA RTX 4070 Ti 12GB

**Лучше всего для:** Быстрая SD 1.5, эффективный вывод

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 12 ГБ GDDR6X        |
| Ширина памяти           | 504 ГБ/с            |
| Производительность FP16 | 40.1 TFLOPS         |
| Тензорные ядра          | 184 (4-е поколение) |
| TDP                     | 285 Вт              |
| \~Цена/час              | $0.04-0.06          |

**Возможности:**

* ✅ Ollama с моделями 7B (быстро)
* ✅ Stable Diffusion 1.5 (очень быстро)
* ✅ SDXL (768x768)
* ⚠️ FLUX schnell (ограниченное разрешение)
* ❌ Большие модели (>13B)
* ❌ Генерация видео

***

### NVIDIA RTX 4080 16GB

**Лучше всего для:** SDXL в продакшне, LLM 13B

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 16 ГБ GDDR6X        |
| Ширина памяти           | 717 ГБ/с            |
| Производительность FP16 | 48.7 TFLOPS         |
| Тензорные ядра          | 304 (4-е поколение) |
| TDP                     | 320 Вт              |
| \~Цена/час              | $0.06-0.09          |

**Возможности:**

* ✅ Ollama с моделями 13B (быстро)
* ✅ vLLM с моделями 7B
* ✅ Все модели Stable Diffusion
* ✅ SDXL + ControlNet
* ✅ FLUX schnell (1024x1024)
* ⚠️ FLUX dev (ограничено)
* ⚠️ Короткие видеоклипы

***

### NVIDIA RTX 4090 24GB

**Лучше всего для:** Производительность высокого класса для потребителей, FLUX, видео

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 24 ГБ GDDR6X        |
| Ширина памяти           | 1008 ГБ/с           |
| Производительность FP16 | 82.6 TFLOPS         |
| Тензорные ядра          | 512 (4-е поколение) |
| TDP                     | 450 Вт              |
| \~Цена/час              | $0.08-0.12          |

**Возможности:**

* ✅ Ollama с моделями 30B (быстро)
* ✅ vLLM с моделями 13B
* ✅ Все модели генерации изображений
* ✅ FLUX dev (1024x1024)
* ✅ Генерация видео (короткие)
* ✅ AnimateDiff
* ⚠️ Модели 70B (только Q4)

***

### NVIDIA RTX 5080 16GB *(Новинка — февраль 2025)*

**Лучше всего для:** Быстрый SDXL/FLUX, LLM 13B-30B, высокопроизводительный средний класс

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 16 ГБ GDDR7         |
| Ширина памяти           | 960 ГБ/с            |
| Производительность FP16 | \~80 TFLOPS         |
| Тензорные ядра          | 336 (5-е поколение) |
| TDP                     | 360 Вт              |
| \~Цена Clore.ai/час     | $1.50-2.00          |

**Возможности:**

* ✅ Ollama с моделями 13B (быстро)
* ✅ vLLM с моделями 13B
* ✅ Все модели Stable Diffusion
* ✅ SDXL + ControlNet (очень быстро)
* ✅ FLUX schnell/dev (1024x1024)
* ✅ Короткие видеоклипы
* ⚠️ Модели 30B (только Q4)
* ❌ Модели 70B

***

### NVIDIA RTX 5090 32GB *(Флагман — февраль 2025)*

**Лучше всего для:** Максимальная потребительская производительность, модели 70B, генерация видео высокого разрешения

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 32 ГБ GDDR7         |
| Ширина памяти           | 1792 ГБ/с           |
| Производительность FP16 | \~120 TFLOPS        |
| Тензорные ядра          | 680 (5-е поколение) |
| TDP                     | 575 Вт              |
| \~Цена Clore.ai/час     | $3.00-4.00          |

**Возможности:**

* ✅ Ollama с моделями 70B (Q4, быстро)
* ✅ vLLM с моделями 30B
* ✅ Все модели генерации изображений
* ✅ FLUX dev (1536x1536)
* ✅ Генерация видео (длиннее клипы)
* ✅ AnimateDiff + ControlNet
* ✅ Обучение моделей (LoRA, небольшие дообучения)
* ✅ DeepSeek-R1 32B distill (FP16)

## Профессиональные/датацентровые GPU

### NVIDIA A100 40GB

**Лучше всего для:** Продакшн LLM, обучение, большие модели

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 40 ГБ HBM2e         |
| Ширина памяти           | 1555 ГБ/с           |
| Производительность FP16 | 77.97 TFLOPS        |
| Тензорные ядра          | 432 (3-е поколение) |
| TDP                     | 400 Вт              |
| \~Цена/час              | $0.15-0.20          |

**Возможности:**

* ✅ Ollama с моделями 70B (Q4)
* ✅ vLLM для production-сервинга
* ✅ Вся генерация изображений
* ✅ FLUX dev (высокое качество)
* ✅ Генерация видео
* ✅ Дообучение моделей
* ⚠️ 70B FP16 (впритык)

***

### NVIDIA A100 80GB

**Лучше всего для:** Модели 70B+, видео, production-нагрузки

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 80 ГБ HBM2e         |
| Ширина памяти           | 2039 ГБ/с           |
| Производительность FP16 | 77.97 TFLOPS        |
| Тензорные ядра          | 432 (3-е поколение) |
| TDP                     | 400 Вт              |
| \~Цена/час              | $0.20-0.30          |

**Возможности:**

* ✅ Все LLM до 70B (FP16)
* ✅ vLLM для высокопроизводительного сервинга
* ✅ Вся генерация изображений
* ✅ Генерация длинного видео
* ✅ Обучение моделей
* ✅ DeepSeek-V3 (частично)
* ⚠️ Модели 100B+

***

### NVIDIA H100 80GB

**Лучше всего для:** Максимальная производительность, самые большие модели

| Характеристики          | Ценность            |
| ----------------------- | ------------------- |
| VRAM                    | 80 ГБ HBM3          |
| Ширина памяти           | 3350 ГБ/с           |
| Производительность FP16 | 267 TFLOPS          |
| Тензорные ядра          | 528 (4-е поколение) |
| TDP                     | 700 Вт              |
| \~Цена/час              | $0.40-0.60          |

**Возможности:**

* ✅ Все модели с максимальной скоростью
* ✅ Модели 100B+ параметров
* ✅ Сервинг нескольких моделей
* ✅ Крупномасштабное обучение
* ✅ Генерация видео в реальном времени
* ✅ DeepSeek-V3 (671B)

## Сравнение производительности

### Вывод LLM (токенов/сек)

| GPU           | Llama 3 8B | Llama 3 70B | Mixtral 8x7B | Clore.ai $/час |
| ------------- | ---------- | ----------- | ------------ | -------------- |
| RTX 3060 12GB | 25         | -           | -            | $0.02-0.04     |
| RTX 3090 24GB | 45         | 8\*         | 20\*         | $0.15-0.25     |
| RTX 4090 24GB | 80         | 15\*        | 35\*         | $0.35-0.55     |
| RTX 5080 16GB | 95         | -           | 40\*         | $1.50-2.00     |
| RTX 5090 32GB | 150        | 30\*        | 65\*         | $3.00-4.00     |
| A100 40GB     | 100        | 25          | 45           | $0.80-1.20     |
| A100 80GB     | 110        | 40          | 55           | $1.20-1.80     |
| H100 80GB     | 180        | 70          | 90           | $2.50-3.50     |

\*С квантованием (Q4/Q8)

### Скорость генерации изображений

| GPU           | SD 1.5 (512) | SDXL (1024) | FLUX schnell | Clore.ai $/час |
| ------------- | ------------ | ----------- | ------------ | -------------- |
| RTX 3060 12GB | 4 сек        | 15 сек      | 25 сек\*     | $0.02-0.04     |
| RTX 3090 24GB | 2 сек        | 7 сек       | 12 сек       | $0.15-0.25     |
| RTX 4090 24GB | 1 сек        | 3 сек       | 5 сек        | $0.35-0.55     |
| RTX 5080 16GB | 0.8 сек      | 2.5 сек     | 4 сек        | $1.50-2.00     |
| RTX 5090 32GB | 0.6 сек      | 1.8 сек     | 3 сек        | $3.00-4.00     |
| A100 40GB     | 1.5 сек      | 4 сек       | 6 сек        | $0.80-1.20     |
| A100 80GB     | 1.5 сек      | 4 сек       | 5 сек        | $1.20-1.80     |

\*С выгрузкой на CPU, более низкое разрешение

### Генерация видео (клип 5 сек)

| GPU           | SVD     | Wan2.1  | Hunyuan |
| ------------- | ------- | ------- | ------- |
| RTX 3090 24GB | 3 мин   | 5 мин\* | -       |
| RTX 4090 24GB | 1.5 мин | 3 мин   | 8 мин\* |
| RTX 5090 32GB | 1 мин   | 2 мин   | 5 мин   |
| A100 40GB     | 1 мин   | 2 мин   | 5 мин   |
| A100 80GB     | 45 сек  | 1.5 мин | 3 мин   |

\*Ограниченное разрешение

## Соотношение цена/производительность

### Лучшее значение по задаче

**Чат/LLM (модели 7B-13B):**

1. 🥇 RTX 3090 24GB - Лучшее соотношение цена/производительность
2. 🥈 RTX 3060 12GB - Самая низкая стоимость
3. 🥉 RTX 4090 24GB - Самая быстрая

**Генерация изображений (SDXL/FLUX):**

1. 🥇 RTX 3090 24GB - Отличный баланс
2. 🥈 RTX 4090 24GB - В 2 раза быстрее
3. 🥉 A100 40GB - Стабильность для продакшна

**Большие модели (70B+):**

1. 🥇 A100 40GB - Лучшее соотношение для 70B
2. 🥈 A100 80GB - Полная точность
3. 🥉 RTX 4090 24GB - Бюджетный вариант (только Q4)

**Генерация видео:**

1. 🥇 A100 40GB - Хороший баланс
2. 🥈 RTX 4090 24GB - Потребительский вариант
3. 🥉 A100 80GB - Для самых длинных клипов

**Обучение моделей:**

1. 🥇 A100 40GB - Стандартный выбор
2. 🥈 A100 80GB - Для больших моделей
3. 🥉 RTX 4090 24GB - Малые модели/LoRA

## Мульти-GPU конфигурации

Некоторым задачам полезно использовать несколько GPU:

| Конфигурация | Сценарий использования     | Общий VRAM |
| ------------ | -------------------------- | ---------- |
| 2x RTX 3090  | Инференс 70B               | 48 ГБ      |
| 2x RTX 4090  | Быстрый 70B, обучение      | 48 ГБ      |
| 2x RTX 5090  | 70B FP16, быстрое обучение | 64 ГБ      |
| 4x RTX 5090  | Модели 100B+               | 128 ГБ     |
| 4x A100 40GB | Модели 100B+               | 160 ГБ     |
| 8x A100 80GB | DeepSeek-V3, Llama 405B    | 640 ГБ     |

## Выбор вашей GPU

### Блок-схема принятия решения

```
Какая у вас основная задача?
│
├─ Чат/LLM
│  ├─ Размер модели?
│  │  ├─ ≤7B → RTX 3060 ($0.15–0.30/день)
│  │  ├─ 7B-30B → RTX 3090 ($0.30–1.00/день)
│  │  ├─ 30B-70B → A100 40GB ($1.50–3.00/день)
│  │  └─ 70B+ → A100 80GB ($2.00–4.00/день)
│
├─ Генерация изображений
│  ├─ Модель?
│  │  ├─ SD 1.5 → RTX 3060 ($0.15–0.30/день)
│  │  ├─ SDXL → RTX 3090 ($0.30–1.00/день)
│  │  └─ FLUX → RTX 4090 ($0.50–2.00/день)
│
├─ Генерация видео
│  ├─ Длина?
│  │  ├─ Короткое (2-5 сек) → RTX 4090 ($0.50–2.00/день)
│  │  └─ Длиннее → A100 40GB+ ($1.50–3.00+/день)
│
└─ Обучение
   ├─ LoRA/малое → RTX 4090 ($0.50–2.00/день)
   └─ Полное дообучение → A100 40GB+ ($1.50–3.00+/день)
```

## Советы по экономии денег

1. **Используйте Spot-заказы** - На 30–50% дешевле, чем по запросу
2. **Начните с малого** - Сначала тестируйте на более дешевых GPU
3. **Квантование моделей** - Q4/Q8 позволяет уместить большие модели в меньше VRAM
4. **Пакетная обработка** - Обрабатывайте несколько запросов за раз
5. **Внепиковые часы** - Лучшая доступность и иногда более низкие цены

> 📚 Смотрите также: [Топ-10 самых дешевых GPU для обучения ИИ в 2025 году](https://blog.clore.ai/top-10-cheapest-gpus-for-ai-training/) | [Лучшая GPU для обучения ИИ — подробное руководство](https://blog.clore.ai/best-gpu-for-ai-training/)

## Следующие шаги

* [Матрица совместимости моделей](/guides/guides_v2-ru/nachalo-raboty/model-compatibility.md) - Какие модели запускаются на каких GPU
* [Каталог Docker-образов](/guides/guides_v2-ru/nachalo-raboty/docker-images.md) - Готовые к использованию образы
* [Руководство по быстрому старту](/guides/guides_v2-ru/quickstart.md) - Начните за 5 минут


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-ru/nachalo-raboty/gpu-comparison.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.