Introduction
184 guides pratiques pour déployer des modèles d’IA, des workloads GPU et des plateformes d’IA sur Clore.ai — la place de marché décentralisée de location de GPU.
Tous les exemples peuvent être exécutés sur des serveurs GPU loués via le Marketplace Clore.ai. Louez de puissants GPU à partir de 0,15 $/jour.
Qu’est-ce que Clore.ai ?
Clore.ai est une place de marché GPU pair à pair où vous louez des GPU directement auprès d’autres personnes — comme Airbnb pour le calcul. Des milliers de GPU sont disponibles 24h/24 et 7j/7, des RTX 3060 économiques aux H100 d’entreprise. Payez avec CLORE, BTC, USDTou USDC.
Pourquoi Clore.ai pour l’IA ?
Abordable — RTX 4090 à partir de 0,50 $/jour (contre 2 à 4 $ chez les fournisseurs cloud)
Aucun engagement — location à l’heure, sans contrat
Accès root complet — conteneurs Docker avec passthrough GPU
Large sélection de GPU — plus de 3 400 machines, plus de 12 800 GPU en ligne
Payez à votre façon — paiements en crypto (CLORE, BTC, USDT/USDC)
📚 Catégories de guides
38
Llama 4, Gemma 3, Qwen3.5, GLM-5, DeepSeek V4, DeepSeek-R1, Nemotron 3 Super, Gemini 3.1 Flash Lite, Ollama, vLLM, SGLang
18
Dify, CrewAI, AutoGPT, OpenHands, MetaGPT, n8n, LibreChat, Open Interpreter, SuperAGI, SWE-agent
22
Voxtral TTS, Whisper, Qwen3-TTS, MiniMax Speech 2.6, Dia, ChatTTS, Kokoro, Fish Speech, MeloTTS, StyleTTS2
13
Wan2.1, FramePack, CubeComposer 4K 360°, LTX-2, CogVideoX, SkyReels, HunyuanVideo, Mochi-1, AnimateDiff
7
service de LLM, fine-tuning, génération vidéo, TTS, frameworks RAG, bases vectorielles
🔥 Nouveautés (mars 2026)
Semaine du 30 mars 2026 — 1 nouveau guide
🔊 Voxtral TTS 🆕 — modèle TTS open-weight 4B de Mistral, 9 langues, clonage vocal zero-shot à partir d’une référence de 3 s, seulement 3 Go de VRAM, Apache 2.0 — guide
Notes de l’industrie (23–30 mars)
Seedance 2.0 (ByteDance) — modèle de génération vidéo de nouvelle génération, lancé dans CapCut/Dreamina. API uniquement, aucun poids auto-hébergeable disponible pour le moment.
Google Lyria 3 Pro — modèle de génération musicale, disponible via l’API Gemini/Vertex AI. API uniquement, aucun déploiement local.
Gemini 3 Deep Think — modèle de raisonnement de pointe de Google, disponible pour les abonnés Ultra. API uniquement.
Arrêt de Sora — OpenAI a officiellement arrêté l’application de génération vidéo Sora.
DeepSeek V4 — en attente de la sortie officielle des poids (morceaux INT8 repérés le 11 mars). Guide prêt : deepseek-v4.md
Semaine du 16 mars 2026 — 3 nouveaux guides
🤖 NVIDIA Nemotron 3 Super 🆕 — MoE 120B / 12B actifs, débit x5, contexte 1M, Apache 2.0, conçu pour l’IA agentique — guide
🌐 Gemini 3.1 Flash Lite 🆕 — le modèle le moins cher/le plus rapide de Google (3 mars 2026), API + alternatives open-source — guide
🎬 Vidéo 4K 360° CubeComposer 🆕 — premier modèle à générer nativement une vidéo panoramique 4K 360° à partir de séquences standard (CVPR 2026) — guide
Également cette semaine (9–16 mars 2026)
GPT-5.4 — publié le 5 mars 2026 ; usage natif de l’ordinateur (75,0 % OSWorld), contexte 1M, combine le pipeline de codage GPT-5.3-Codex avec un raisonnement général. API uniquement, aucun déploiement local.
DeepSeek V4 ⏳ — poids repérés sur HuggingFace (morceaux INT8, 11 mars) — sortie imminente d’un MoE multimodal de 1T paramètres. Guide prêt lorsqu’il sortira.
Wan 2.2 — nouvelle version du modèle de fondation de génération vidéo Wan (variante image-vers-vidéo 12V en ligne sur HuggingFace)
Nouveautés de mars 2026 — 6 nouvelles catégories, 57 nouveaux guides
🔄 MLOps — 4 guides : MLflow, Triton Inference Server, BentoML, ClearML
⚡ DevOps GPU — 2 guides : TensorRT-LLM, ONNX Runtime
🔬 Science — 3 guides : AlphaFold2, ESMFold, GROMACS dynamique moléculaire
🎮 Jeux / streaming — Sunshine + Moonlight jeu à distance accéléré par GPU
₿ Minage de cryptomonnaie — XMRig minage CPU/GPU sur Clore.ai
Derniers modèles ajoutés (4 mars 2026)
DeepSeek V4 ⏳ — MoE multimodal d’environ 1T de paramètres, licence MIT, sortie imminente (poids repérés le 11 mars) — guide
MiniMax Speech 2.6 🆕 — TTS à très faible latence pour agents vocaux, TTFB < 300 ms — guide
SGLang 🆕 — RadixAttention pour le partage du cache KV, débit x2 à x5 par rapport à vLLM sur MoE — guide
TGI 🆕 — service LLM de production de HuggingFace avec Flash Attention 2 + PagedAttention — guide
LLaMA-Factory 🆕 — affinez plus de 100 LLM avec WebUI, LoRA/QLoRA, RLHF — guide
Fish Speech 🆕 — clonage vocal zero-shot dans plus de 8 langues à partir de 10 à 15 s d’audio de référence — guide
Mochi-1 🆕 — diffusion vidéo 10B paramètres, 848×480 à 30 ips, 24 Go de VRAM — guide
Ajoutés précédemment (février 2026)
Qwen3.5 — MoE 397B d’Alibaba, bat Claude 4.5 Opus en mathématiques
GLM-5 — MoE 744B de Zhipu AI, licence MIT, n°1 dans les classements open source
Ling-2.5-1T — modèle d’Ant Group à un trillion de paramètres avec attention linéaire
Kimi K2.5 — MoE 1T de Moonshot AI, licence MIT, agentique visuel
Mistral Large 3 — MoE 675B, Apache 2.0, codage et raisonnement de pointe
Llama 4 Scout/Maverick — révolution MoE de Meta, fenêtre de contexte de 10M
Gemma 3 — le modèle 27B de Google qui bat des modèles 405B
FLUX.2 Klein — génération d’images en moins d’une seconde (< 0,5 s sur RTX 4090)
HunyuanImage 3.0 — MoE 80B, plus grand modèle d’images open source
ACE-Step 1.5 — génération de chansons complètes avec moins de 4 Go de VRAM
FramePack — vidéo IA avec seulement 6 Go de VRAM
Qwen3-TTS — clonage vocal dans plus de 10 langues à partir de 3 secondes d’audio
Kani-TTS-2 — TTS ultra-léger, seulement 3 Go de VRAM
DeepSeek-R1 — modèle de raisonnement équivalent à OpenAI o1
Catégories ajoutées précédemment (février 2026)
🤖 Plateformes d’IA et agents — 18 guides : Dify, CrewAI, AutoGPT, OpenHands, MetaGPT, n8n, LibreChat, Open Interpreter, SuperAGI, SWE-agent
🎵 Génération musicale — chansons composées par IA avec voix (ACE-Step)
💻 Outils de codage IA — alternatives Copilot auto-hébergées (Aider, TabbyML)
🔧 OpenClaw sur Clore — faites tourner votre assistant IA 24h/24 et 7j/7 sur des GPU loués
💰 Tarification des GPU (mars 2026)
Données en direct de la place de marché Clore.ai, échantillonnées le 16 mars 2026 (2 592 serveurs).
RTX 3060
12 Go
0,16 à 1,00 $/h
~$0.93
TTS, petits modèles, génération musicale
RTX 3070
8 Go
0,17 à 3,33 $/h
~$0.55
modèles 7B, Whisper, inférence par lots
RTX 3080
10 Go
0,20 à 3,50 $/h
~$0.79
modèles 7B–14B, génération d’images
RTX 3090
24 Go
0,08 à 4,00 $/h
~$1.24
SDXL, modèles 32B, génération vidéo
RTX 4090
24 Go
1,19 à 6,50 $/h
~$2.44
FLUX, Llama 4, modèles 35B
RTX 5070 Ti
16 Go
0,75 à 3,00 $/h
~$1.31
inférence rapide, LLM 30B
RTX 5080
16 Go
0,90 à 9,00 $/h
~$1.86
FLUX rapide, LLM 30B
RTX 5090
32 Go
1,72 à 10,00 $/h
~$3.94
70B quantifié, Nemotron 3 Super, le plus rapide
A100 80GB
80 Go
~20 $/h
~$20
70B FP16, entraînement à grande échelle
H100 80GB
80 Go
5 à 10 $/h
~6 à 8 $
modèles 400B+, production
Les commandes Spot sont 20 à 40 % moins chères que le tarif à la demande. Le parc de RTX 5090 compte désormais plus de 218 cartes. La RTX 5070 Ti s’est imposée comme une forte option milieu de gamme (73 serveurs).
🚀 Démarrage rapide
Nouveau sur Clore.ai ? → Guide de démarrage rapide
Vous savez déjà ce dont vous avez besoin ?
📖 Documentation et support
Documentation principale: docs.clore.ai
Ces guides: docs.clore.ai/guides
Marketplace: clore.ai/marketplace
Support: clore.ai/support / [email protected]
Discord: discord.com/invite/clore-ai
Telegram: @clorechat
Mis à jour
Ce contenu vous a-t-il été utile ?