Traitement par lots

Traitez de grandes charges de travail IA efficacement sur les GPU Clore.ai

Traitez de grandes charges de travail efficacement sur les GPU CLORE.AI.

circle-check

Quand utiliser le traitement par lots

  • Traitement de centaines/milliers d'éléments

  • Conversion de grandes ensembles de données

  • Génération de nombreuses images/vidéos

  • Transcription en masse

  • Préparation des données d'entraînement


Traitement par lots pour LLM

API de lots vLLM

vLLM gère le batching automatiquement avec le batching continu :

from openai import OpenAI
import asyncio
import aiohttp

client = OpenAI(base_url="http://server:8000/v1", api_key="dummy")

# Lot synchrone
def process_batch_sync(prompts):
    results = []
    for prompt in prompts:
        response = client.chat.completions.create(
            model="meta-llama/Llama-3.1-8B-Instruct",
            messages=[{"role": "user", "content": prompt}]
        )
        results.append(response.choices[0].message.content)
    return results

# Traiter 100 prompts
prompts = [f"Résumer le sujet {i}" for i in range(100)]
results = process_batch_sync(prompts)

Traitement par lots asynchrone (plus rapide)

Lot avec suivi de progression

Sauvegarder la progression pour les longs lots


Génération d'images par lots

Lot SD WebUI

Lot ComfyUI avec file d'attente

Traitement par lots FLUX


Traitement audio par lots

Transcription par lots Whisper

Whisper parallèle (plusieurs GPU)


Traitement vidéo par lots

Génération vidéo par lots (SVD)


Patrons de pipeline de données

Patron producteur-consommateur

Patron Map-Reduce


Conseils d'optimisation

1. Adapter la concurrence

2. Ajustement de la taille des lots

3. Gestion de la mémoire

4. Sauvegarder les résultats intermédiaires


Optimisation des coûts

Estimer avant d'exécuter

Utiliser des instances Spot

  • 30-50% moins cher

  • Bon pour les jobs par lots (interrompables)

  • Sauvegardez les points de contrôle fréquemment

Traitement hors pointe

  • Mettre les jobs en file pendant les heures de faible demande

  • Souvent meilleure disponibilité des GPU

  • Prix Spot potentiellement plus bas


Prochaines étapes

Mis à jour

Ce contenu vous a-t-il été utile ?