Procesamiento por lotes

Procesa grandes cargas de trabajo de IA eficientemente en las GPU de Clore.ai

Procese grandes cargas de trabajo de manera eficiente en las GPU de CLORE.AI.

circle-check

Usando el SDK clore-ai para Infraestructura por Lotes (Recomendado)

El SDK oficial simplifica el aprovisionamiento de GPU por lotes con soporte asíncrono:

import asyncio
from clore_ai import AsyncCloreAI

async def batch_deploy(server_ids):
    """Desplegar en múltiples servidores concurrentemente."""
    async with AsyncCloreAI() as client:
        tasks = [
            client.create_order(
                server_id=sid,
                image="cloreai/ubuntu22.04-cuda12",
                type="on-demand",
                currency="bitcoin",
                ssh_password="BatchPass123",
                ports={"22": "tcp"}
            )
            for sid in server_ids
        ]
        results = await asyncio.gather(*tasks, return_exceptions=True)
        for sid, result in zip(server_ids, results):
            if isinstance(result, Exception):
                print(f"❌ Server {sid}: {result}")
            else:
                print(f"✅ Server {sid}: Order {result.id}")
        return results

# Desplegar en 5 servidores a la vez
asyncio.run(batch_deploy([142, 305, 891, 450, 612]))

→ Ver Guía del SDK de Python y Automatización CLI para más información.


Cuándo usar el procesamiento por lotes

  • Procesamiento de cientos/miles de elementos

  • Conversión de grandes conjuntos de datos

  • Generación de muchas imágenes/videos

  • Transcripción masiva

  • Preparación de datos de entrenamiento


Procesamiento por lotes para LLM

API de lotes vLLM

vLLM maneja el batching automáticamente con batching continuo:

Procesamiento por lotes asíncrono (Más rápido)

Lote con seguimiento de progreso

Guardar progreso para lotes largos


Generación de imágenes por lote

SD WebUI por lote

ComfyUI por lote con cola

Procesamiento por lotes FLUX


Procesamiento de audio por lotes

Transcripción por lotes con Whisper

Whisper en paralelo (múltiples GPU)


Procesamiento de video por lotes

Generación de video por lotes (SVD)


Patrones de canalización de datos

Patrón Productor-Consumidor

Patrón Map-Reduce


Consejos de optimización

1. Ajustar la concurrencia al tamaño adecuado

2. Ajuste del tamaño de lote

3. Gestión de memoria

4. Guardar resultados intermedios


Optimización de costos

Estimar antes de ejecutar

Use instancias spot

  • 30-50% más barato

  • Bueno para trabajos por lotes (interrumpibles)

  • Guarde puntos de control con frecuencia

Procesamiento fuera de hora pico

  • Encole trabajos durante las horas de baja demanda

  • A menudo mejor disponibilidad de GPU

  • Posiblemente precios spot más bajos


Próximos pasos

Última actualización

¿Te fue útil?