> For the complete documentation index, see [llms.txt](https://docs.clore.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.clore.ai/guides/guides_v2-fr/prise-en-main/gpu-comparison.md).

# Comparaison des GPU

Comparaison complète des GPU disponibles sur CLORE.AI pour les charges de travail IA.

{% hint style="success" %}
Trouvez le GPU adapté à votre tâche sur [Place de marché CLORE.AI](https://clore.ai/marketplace).
{% endhint %}

## Recommandation rapide

| Votre tâche                  | Choix budget  | Meilleur rapport qualité/prix | Performance maximale |
| ---------------------------- | ------------- | ----------------------------- | -------------------- |
| Chat avec IA (7B)            | RTX 3060 12GB | RTX 3090 24GB                 | RTX 5090 32GB        |
| Chat avec IA (70B)           | RTX 3090 24GB | RTX 5090 32GB                 | A100 80GB            |
| Génération d'images (SD 1.5) | RTX 3060 12GB | RTX 3090 24GB                 | RTX 5090 32GB        |
| Génération d'images (SDXL)   | RTX 3090 24GB | RTX 4090 24GB                 | RTX 5090 32GB        |
| Génération d'images (FLUX)   | RTX 3090 24GB | RTX 5090 32GB                 | A100 80GB            |
| Génération vidéo             | RTX 4090 24GB | RTX 5090 32GB                 | A100 80GB            |
| Entraînement de modèle       | A100 40GB     | A100 80GB                     | H100 80GB            |

## GPU grand public

### NVIDIA RTX 3060 12GB

**Idéal pour :** IA à petit budget, SD 1.5, petits LLMs

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 12GB GDDR6   |
| Bande passante mémoire | 360 GB/s     |
| Performance FP16       | 12,7 TFLOPS  |
| Cœurs Tensor           | 112 (3e gen) |
| TDP                    | 170W         |
| \~Prix/heure           | $0.02-0.04   |

**Capacités :**

* ✅ Ollama avec modèles 7B (T4)
* ✅ Stable Diffusion 1.5 (512x512)
* ✅ SDXL (768x768, lent)
* ⚠️ FLUX schnell (avec déchargement CPU)
* ❌ Gros modèles (>13B)
* ❌ Génération vidéo

***

### NVIDIA RTX 3070/3070 Ti 8GB

**Idéal pour :** SD 1.5, tâches légères

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 8GB GDDR6X   |
| Bande passante mémoire | 448-608 GB/s |
| Performance FP16       | 20,3 TFLOPS  |
| Cœurs Tensor           | 184 (3e gen) |
| TDP                    | 220-290W     |
| \~Prix/heure           | $0.02-0.04   |

**Capacités :**

* ✅ Ollama avec modèles 7B (T4)
* ✅ Stable Diffusion 1.5 (512x512)
* ⚠️ SDXL (seulement basse résolution)
* ❌ FLUX (VRAM insuffisante)
* ❌ Modèles >7B
* ❌ Génération vidéo

***

### NVIDIA RTX 3080/3080 Ti 10-12GB

**Idéal pour :** Tâches IA générales, bon équilibre

| Spécification          | Valeur           |
| ---------------------- | ---------------- |
| VRAM                   | 10-12GB GDDR6X   |
| Bande passante mémoire | 760-912 GB/s     |
| Performance FP16       | 29,8-34,1 TFLOPS |
| Cœurs Tensor           | 272-320 (3e gen) |
| TDP                    | 320-350W         |
| \~Prix/heure           | $0.04-0.06       |

**Capacités :**

* ✅ Ollama avec modèles 13B
* ✅ Stable Diffusion 1.5/2.1
* ✅ SDXL (1024x1024)
* ⚠️ FLUX schnell (avec déchargement)
* ❌ Gros modèles (>13B)
* ❌ Génération vidéo

***

### NVIDIA RTX 3090/3090 Ti 24GB

**Idéal pour :** SDXL, LLMs 13B-30B, ControlNet

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 24GB GDDR6X  |
| Bande passante mémoire | 936 GB/s     |
| Performance FP16       | 35,6 TFLOPS  |
| Cœurs Tensor           | 328 (3e gen) |
| TDP                    | 350-450W     |
| \~Prix/heure           | $0.05-0.08   |

**Capacités :**

* ✅ Ollama avec modèles 30B
* ✅ vLLM avec modèles 13B
* ✅ Tous les modèles Stable Diffusion
* ✅ SDXL + ControlNet
* ✅ FLUX schnell (1024x1024)
* ⚠️ FLUX dev (avec déchargement)
* ⚠️ Vidéo (clips courts)

***

### NVIDIA RTX 4070 Ti 12GB

**Idéal pour :** SD 1.5 rapide, inférence efficace

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 12GB GDDR6X  |
| Bande passante mémoire | 504 GB/s     |
| Performance FP16       | 40,1 TFLOPS  |
| Cœurs Tensor           | 184 (4e gen) |
| TDP                    | 285W         |
| \~Prix/heure           | $0.04-0.06   |

**Capacités :**

* ✅ Ollama avec modèles 7B (rapide)
* ✅ Stable Diffusion 1.5 (très rapide)
* ✅ SDXL (768x768)
* ⚠️ FLUX schnell (résolution limitée)
* ❌ Gros modèles (>13B)
* ❌ Génération vidéo

***

### NVIDIA RTX 4080 16GB

**Idéal pour :** SDXL production, LLMs 13B

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 16GB GDDR6X  |
| Bande passante mémoire | 717 GB/s     |
| Performance FP16       | 48,7 TFLOPS  |
| Cœurs Tensor           | 304 (4e gen) |
| TDP                    | 320W         |
| \~Prix/heure           | $0.06-0.09   |

**Capacités :**

* ✅ Ollama avec modèles 13B (rapide)
* ✅ vLLM avec modèles 7B
* ✅ Tous les modèles Stable Diffusion
* ✅ SDXL + ControlNet
* ✅ FLUX schnell (1024x1024)
* ⚠️ FLUX dev (limité)
* ⚠️ Clips vidéo courts

***

### NVIDIA RTX 4090 24GB

**Idéal pour :** Performance grand public haut de gamme, FLUX, vidéo

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 24GB GDDR6X  |
| Bande passante mémoire | 1008 GB/s    |
| Performance FP16       | 82,6 TFLOPS  |
| Cœurs Tensor           | 512 (4e gen) |
| TDP                    | 450W         |
| \~Prix/heure           | $0.08-0.12   |

**Capacités :**

* ✅ Ollama avec modèles 30B (rapide)
* ✅ vLLM avec modèles 13B
* ✅ Tous les modèles de génération d'images
* ✅ FLUX dev (1024x1024)
* ✅ Génération vidéo (courte)
* ✅ AnimateDiff
* ⚠️ Modèles 70B (T4 seulement)

***

### NVIDIA RTX 5080 16GB *(Nouveau — Fév 2025)*

**Idéal pour :** SDXL/FLUX rapide, LLMs 13B-30B, milieu de gamme haute performance

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 16GB GDDR7   |
| Bande passante mémoire | 960 GB/s     |
| Performance FP16       | \~80 TFLOPS  |
| Cœurs Tensor           | 336 (5e gen) |
| TDP                    | 360W         |
| \~Prix Clore.ai/heure  | $1.50-2.00   |

**Capacités :**

* ✅ Ollama avec modèles 13B (rapide)
* ✅ vLLM avec modèles 13B
* ✅ Tous les modèles Stable Diffusion
* ✅ SDXL + ControlNet (très rapide)
* ✅ FLUX schnell/dev (1024x1024)
* ✅ Clips vidéo courts
* ⚠️ Modèles 30B (T4 seulement)
* ❌ Modèles 70B

***

### NVIDIA RTX 5090 32GB *(Phare — Fév 2025)*

**Idéal pour :** Performance grand public maximale, modèles 70B, génération vidéo haute résolution

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 32GB GDDR7   |
| Bande passante mémoire | 1792 GB/s    |
| Performance FP16       | \~120 TFLOPS |
| Cœurs Tensor           | 680 (5e gen) |
| TDP                    | 575W         |
| \~Prix Clore.ai/heure  | $3.00-4.00   |

**Capacités :**

* ✅ Ollama avec modèles 70B (T4, rapide)
* ✅ vLLM avec modèles 30B
* ✅ Tous les modèles de génération d'images
* ✅ FLUX dev (1536x1536)
* ✅ Génération vidéo (clips plus longs)
* ✅ AnimateDiff + ControlNet
* ✅ Entraînement de modèles (LoRA, petits fine-tunes)
* ✅ Distillation DeepSeek-R1 32B (FP16)

## GPU professionnels/Datacenter

### NVIDIA A100 40GB

**Idéal pour :** LLMs de production, entraînement, grands modèles

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 40GB HBM2e   |
| Bande passante mémoire | 1555 GB/s    |
| Performance FP16       | 77,97 TFLOPS |
| Cœurs Tensor           | 432 (3e gen) |
| TDP                    | 400W         |
| \~Prix/heure           | $0.15-0.20   |

**Capacités :**

* ✅ Ollama avec modèles 70B (T4)
* ✅ Service de production vLLM
* ✅ Toute génération d'images
* ✅ FLUX dev (haute qualité)
* ✅ Génération vidéo
* ✅ Fine-tuning de modèles
* ⚠️ 70B FP16 (serré)

***

### NVIDIA A100 80GB

**Idéal pour :** Modèles 70B+, vidéo, charges de production

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 80GB HBM2e   |
| Bande passante mémoire | 2039 GB/s    |
| Performance FP16       | 77,97 TFLOPS |
| Cœurs Tensor           | 432 (3e gen) |
| TDP                    | 400W         |
| \~Prix/heure           | $0.20-0.30   |

**Capacités :**

* ✅ Tous les LLMs jusqu'à 70B (FP16)
* ✅ Service vLLM à haut débit
* ✅ Toute génération d'images
* ✅ Génération vidéo longue
* ✅ Entraînement de modèles
* ✅ DeepSeek-V3 (partiel)
* ⚠️ Modèles 100B+

***

### NVIDIA H100 80GB

**Idéal pour :** Performance maximale, plus grands modèles

| Spécification          | Valeur       |
| ---------------------- | ------------ |
| VRAM                   | 80GB HBM3    |
| Bande passante mémoire | 3350 GB/s    |
| Performance FP16       | 267 TFLOPS   |
| Cœurs Tensor           | 528 (4e gen) |
| TDP                    | 700W         |
| \~Prix/heure           | $0.40-0.60   |

**Capacités :**

* ✅ Tous les modèles à vitesse maximale
* ✅ Modèles de 100B+ paramètres
* ✅ Service multi-modèles
* ✅ Entraînement à grande échelle
* ✅ Génération vidéo en temps réel
* ✅ DeepSeek-V3 (671B)

## Comparaisons de performances

### Inférence LLM (tokens/seconde)

| GPU           | Llama 3 8B | Llama 3 70B | Mixtral 8x7B | Clore.ai $/h |
| ------------- | ---------- | ----------- | ------------ | ------------ |
| RTX 3060 12GB | 25         | -           | -            | $0.02-0.04   |
| RTX 3090 24GB | 45         | 8\*         | 20\*         | $0.15-0.25   |
| RTX 4090 24GB | 80         | 15\*        | 35\*         | $0.35-0.55   |
| RTX 5080 16GB | 95         | -           | 40\*         | $1.50-2.00   |
| RTX 5090 32GB | 150        | 30\*        | 65\*         | $3.00-4.00   |
| A100 40GB     | 100        | 25          | 45           | $0.80-1.20   |
| A100 80GB     | 110        | 40          | 55           | $1.20-1.80   |
| H100 80GB     | 180        | 70          | 90           | $2.50-3.50   |

\*Avec quantification (Q4/Q8)

### Vitesse de génération d'images

| GPU           | SD 1.5 (512) | SDXL (1024) | FLUX schnell | Clore.ai $/h |
| ------------- | ------------ | ----------- | ------------ | ------------ |
| RTX 3060 12GB | 4 s          | 15 s        | 25 s\*       | $0.02-0.04   |
| RTX 3090 24GB | 2 s          | 7 s         | 12 s         | $0.15-0.25   |
| RTX 4090 24GB | 1 s          | 3 s         | 5 s          | $0.35-0.55   |
| RTX 5080 16GB | 0,8 s        | 2,5 s       | 4 s          | $1.50-2.00   |
| RTX 5090 32GB | 0,6 s        | 1,8 s       | 3 s          | $3.00-4.00   |
| A100 40GB     | 1,5 s        | 4 s         | 6 s          | $0.80-1.20   |
| A100 80GB     | 1,5 s        | 4 s         | 5 s          | $1.20-1.80   |

\*Avec déchargement CPU, résolution plus faible

### Génération vidéo (clip de 5 s)

| GPU           | SVD     | Wan2.1  | Hunyuan |
| ------------- | ------- | ------- | ------- |
| RTX 3090 24GB | 3 min   | 5 min\* | -       |
| RTX 4090 24GB | 1,5 min | 3 min   | 8 min\* |
| RTX 5090 32GB | 1 min   | 2 min   | 5 min   |
| A100 40GB     | 1 min   | 2 min   | 5 min   |
| A100 80GB     | 45 s    | 1,5 min | 3 min   |

\*Résolution limitée

## Rapport prix/performances

### Meilleur rapport qualité/prix par tâche

**Chat/LLM (modèles 7B-13B) :**

1. 🥇 RTX 3090 24GB - Meilleur prix/performances
2. 🥈 RTX 3060 12GB - Coût le plus bas
3. 🥉 RTX 4090 24GB - Le plus rapide

**Génération d'images (SDXL/FLUX) :**

1. 🥇 RTX 3090 24GB - Excellent équilibre
2. 🥈 RTX 4090 24GB - 2x plus rapide
3. 🥉 A100 40GB - Stabilité en production

**Grands modèles (70B+) :**

1. 🥇 A100 40GB - Meilleur rapport pour 70B
2. 🥈 A100 80GB - Précision complète
3. 🥉 RTX 4090 24GB - Option budget (T4 seulement)

**Génération vidéo :**

1. 🥇 A100 40GB - Bon équilibre
2. 🥈 RTX 4090 24GB - Option grand public
3. 🥉 A100 80GB - Clips les plus longs

**Entraînement de modèle :**

1. 🥇 A100 40GB - Choix standard
2. 🥈 A100 80GB - Grands modèles
3. 🥉 RTX 4090 24GB - Petits modèles/LoRA

## Configurations multi-GPU

Certaines tâches bénéficient de plusieurs GPU :

| Configuration | Cas d'utilisation             | VRAM totale |
| ------------- | ----------------------------- | ----------- |
| 2x RTX 3090   | Inférence 70B                 | 48GB        |
| 2x RTX 4090   | 70B rapide, entraînement      | 48GB        |
| 2x RTX 5090   | 70B FP16, entraînement rapide | 64GB        |
| 4x RTX 5090   | Modèles 100B+                 | 128GB       |
| 4x A100 40GB  | Modèles 100B+                 | 160GB       |
| 8x A100 80GB  | DeepSeek-V3, Llama 405B       | 640GB       |

## Choisir votre GPU

### Organigramme de décision

```
Quelle est votre tâche principale ?
│
├─ Chat/LLM
│  ├─ Taille du modèle ?
│  │  ├─ ≤7B → RTX 3060 (0,15–0,30 $/jour)
│  │  ├─ 7B-30B → RTX 3090 (0,30–1,00 $/jour)
│  │  ├─ 30B-70B → A100 40GB (1,50–3,00 $/jour)
│  │  └─ 70B+ → A100 80GB (2,00–4,00 $/jour)
│
├─ Génération d'images
│  ├─ Modèle ?
│  │  ├─ SD 1.5 → RTX 3060 (0,15–0,30 $/jour)
│  │  ├─ SDXL → RTX 3090 (0,30–1,00 $/jour)
│  │  └─ FLUX → RTX 4090 (0,50–2,00 $/jour)
│
├─ Génération vidéo
│  ├─ Durée ?
│  │  ├─ Courte (2-5 s) → RTX 4090 (0,50–2,00 $/jour)
│  │  └─ Plus longue → A100 40GB+ (1,50–3,00+ $/jour)
│
└─ Entraînement
   ├─ LoRA/petits → RTX 4090 (0,50–2,00 $/jour)
   └─ Fine-tune complet → A100 40GB+ (1,50–3,00+ $/jour)
```

## Conseils pour économiser de l'argent

1. **Utilisez les commandes Spot** - 30-50% moins cher que à la demande
2. **Commencez petit** - Testez d'abord sur des GPU moins chers
3. **Quantifier les modèles** - Q4/Q8 permet d'adapter de plus grands modèles dans moins de VRAM
4. **Traitement par lots** - Traitez plusieurs requêtes à la fois
5. **Heures creuses** - Meilleure disponibilité et parfois prix plus bas

> 📚 Voir aussi : [Top 10 des GPU les moins chers pour l'entraînement IA en 2025](https://blog.clore.ai/top-10-cheapest-gpus-for-ai-training/) | [Meilleur GPU pour l'entraînement IA — Guide détaillé](https://blog.clore.ai/best-gpu-for-ai-training/)

## Prochaines étapes

* [Matrice de compatibilité des modèles](/guides/guides_v2-fr/prise-en-main/model-compatibility.md) - Quels modèles fonctionnent sur quels GPU
* [Catalogue d'images Docker](/guides/guides_v2-fr/prise-en-main/docker-images.md) - Images prêtes à l'emploi
* [Guide de démarrage rapide](/guides/guides_v2-fr/quickstart.md) - Commencez en 5 minutes


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-fr/prise-en-main/gpu-comparison.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.