Procesamiento por lotes

Procesa grandes cargas de trabajo de IA de manera eficiente en GPUs de Clore.ai

Procese grandes cargas de trabajo de manera eficiente en las GPU de CLORE.AI.

circle-check

Cuándo usar el procesamiento por lotes

  • Procesamiento de cientos/miles de elementos

  • Conversión de grandes conjuntos de datos

  • Generación de muchas imágenes/videos

  • Transcripción masiva

  • Preparación de datos de entrenamiento


Procesamiento por lotes de LLM

API de Lotes vLLM

vLLM maneja el batching automáticamente con batching continuo:

from openai import OpenAI
import asyncio
import aiohttp

client = OpenAI(base_url="http://server:8000/v1", api_key="dummy")

# Lote sincrónico
def process_batch_sync(prompts):
    results = []
    for prompt in prompts:
        response = client.chat.completions.create(
            model="meta-llama/Llama-3.1-8B-Instruct",
            messages=[{"role": "user", "content": prompt}]
        )
        results.append(response.choices[0].message.content)
    return results

# Procesar 100 prompts
prompts = [f"Resumir el tema {i}" for i in range(100)]
results = process_batch_sync(prompts)

Procesamiento por lotes asíncrono (más rápido)

Lote con seguimiento de progreso

Guardar el progreso para lotes largos


Generación de imágenes por lotes

Lote SD WebUI

Lote ComfyUI con cola

Procesamiento por lotes FLUX


Procesamiento de audio por lotes

Transcripción por lotes con Whisper

Whisper en paralelo (múltiples GPU)


Procesamiento de video por lotes

Generación de videos por lotes (SVD)


Patrones de canalización de datos

Patrón Productor-Consumidor

Patrón Map-Reduce


Consejos de optimización

1. Dimensionar correctamente la concurrencia

2. Ajuste del tamaño del lote

3. Gestión de memoria

4. Guardar resultados intermedios


Optimización de costos

Estimar antes de ejecutar

Usar instancias spot

  • 30-50% más barato

  • Bueno para trabajos por lotes (interrumpibles)

  • Guardar puntos de control con frecuencia

Procesamiento fuera de las horas pico

  • Encolar trabajos durante horas de baja demanda

  • A menudo mejor disponibilidad de GPU

  • Posiblemente precios spot más bajos


Próximos pasos

Última actualización

¿Te fue útil?