Traitement par lots

Traitez de lourdes charges IA efficacement sur les GPU Clore.ai

Traitez de grandes charges de travail efficacement sur les GPU CLORE.AI.

circle-check

Utilisation du SDK clore-ai pour l'infrastructure par lots (recommandé)

Le SDK officiel simplifie la fourniture de GPU en batch avec prise en charge asynchrone :

import asyncio
from clore_ai import AsyncCloreAI

async def batch_deploy(server_ids):
    """Déployer sur plusieurs serveurs simultanément."""
    async with AsyncCloreAI() as client:
        tasks = [
            client.create_order(
                server_id=sid,
                image="cloreai/ubuntu22.04-cuda12",
                type="on-demand",
                currency="bitcoin",
                ssh_password="BatchPass123",
                ports={"22": "tcp"}
            )
            for sid in server_ids
        ]
        results = await asyncio.gather(*tasks, return_exceptions=True)
        for sid, result in zip(server_ids, results):
            if isinstance(result, Exception):
                print(f"❌ Server {sid}: {result}")
            else:
                print(f"✅ Server {sid}: Order {result.id}")
        return results

# Déployer sur 5 serveurs en même temps
asyncio.run(batch_deploy([142, 305, 891, 450, 612]))

→ Voir Guide du SDK Python et Automatisation CLI pour plus d'informations.


Quand utiliser le traitement par lots

  • Traitement de centaines/milliers d'éléments

  • Conversion de grands jeux de données

  • Génération de nombreuses images/vidéos

  • Transcription en masse

  • Préparation des données d'entraînement


Traitement par lots pour LLM

API de batch vLLM

vLLM gère automatiquement le batching avec batching continu :

Traitement asynchrone par lots (plus rapide)

Batch avec suivi de progression

Enregistrer la progression pour les longs batches


Génération d'images en batch

SD WebUI Batch

ComfyUI Batch avec file d'attente

Traitement par lots FLUX


Traitement audio par lots

Transcription en batch avec Whisper

Whisper parallèle (plusieurs GPU)


Traitement vidéo par lots

Génération vidéo par lots (SVD)


Schémas de pipeline de données

Pattern Producteur-Consommateur

Pattern Map-Reduce


Conseils d'optimisation

1. Dimensionner correctement la concurrence

2. Ajustement de la taille des lots

3. Gestion de la mémoire

4. Sauvegarder les résultats intermédiaires


Optimisation des coûts

Estimer avant d'exécuter

Utiliser des instances spot

  • 30-50% moins cher

  • Bon pour les tâches par lots (interruptibles)

  • Sauvegarder les checkpoints fréquemment

Traitement hors pics

  • Mettre les jobs en file pendant les heures de faible demande

  • Souvent meilleure disponibilité des GPU

  • Possiblement des prix spot plus bas


Étapes suivantes

Mis à jour

Ce contenu vous a-t-il été utile ?