LLaVA
Chatea con imágenes usando el modelo visión-lenguaje LLaVA en Clore.ai
Alquilar en CLORE.AI
Accede a tu servidor
¿Qué es LLaVA?
Variantes de modelo
Modelo
Tamaño
VRAM
Calidad
Despliegue rápido
Accediendo a tu servicio
Instalación
Uso básico
API de Python
Usando Transformers
Integración con Ollama (Recomendado)
API de LLaVA vía Ollama
Método de trabajo: /api/generate
NO funciona: /api/chat (devuelve null para visión)
Python con Ollama
Ejemplo completo que funciona
Casos de uso
Descripción de la imagen
OCR / Extracción de texto
Análisis de gráficos
Código de una captura de pantalla
Detección de objetos
Interfaz Gradio
Servidor API
Procesamiento por lotes
Optimización de memoria
Cuantización a 4 bits
Descarga a CPU (CPU Offload)
Rendimiento
Modelo
GPU
Tokens/seg
Solución de problemas
Memoria insuficiente
Generación lenta
Calidad pobre
Estimación de costos
GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas
Próximos pasos
Última actualización
¿Te fue útil?