LLaVA

Общайтесь с изображениями с помощью модели LLaVA vision-language на Clore.ai

Общайтесь с изображениями с помощью LLaVA — открытой альтернативы GPT-4V.

circle-check

Аренда на CLORE.AI

  1. Отфильтруйте по типу GPU, объему VRAM и цене

  2. Выберите On-Demand (фиксированная ставка) или Spot (цена по ставке)

  3. Настройте ваш заказ:

    • Выберите Docker-образ

    • Установите порты (TCP для SSH, HTTP для веб-интерфейсов)

    • Добавьте переменные окружения при необходимости

    • Введите команду запуска

  4. Выберите способ оплаты: CLORE, BTC, или USDT/USDC

  5. Создайте заказ и дождитесь развертывания

Доступ к вашему серверу

  • Найдите данные для подключения в Моих заказах

  • Веб-интерфейсы: используйте URL HTTP-порта

  • SSH: ssh -p <port> root@<proxy-address>

Что такое LLaVA?

LLaVA (Large Language and Vision Assistant) может:

  • Понимать и описывать изображения

  • Отвечать на вопросы о визуальном содержимом

  • Анализировать графики, диаграммы, скриншоты

  • Оптическое распознавание текста (OCR) и понимание документов

Варианты моделей

Модель
Размер
VRAM
Качество

LLaVA-1.5-7B

7B

8GB

Хорошо

LLaVA-1.5-13B

13B

16GB

Лучше

LLaVA-1.6-34B

34B

40GB

Лучшее

LLaVA-NeXT

7-34B

8-40GB

Последняя

Быстрое развертывание

Docker-образ:

Порты:

Команда:

Доступ к вашему сервису

После развертывания найдите ваш http_pub URL в Моих заказах:

  1. Перейдите на Моих заказах страницу

  2. Нажмите на ваш заказ

  3. Найдите http_pub URL (например, abc123.clorecloud.net)

Используйте https://YOUR_HTTP_PUB_URL вместо localhost в примерах ниже.

Установка

Базовое использование

Python API

Использование Transformers

Интеграция с Ollama (рекомендуется)

Самый простой способ запустить LLaVA на CLORE.AI:

API LLaVA через Ollama

circle-exclamation

Рабочий метод: /api/generate

Ответ:

НЕ РАБОТАЕТ: /api/chat (возвращает null для зрения)

Python с Ollama

Полный рабочий пример

Сценарии использования

Описание изображения

OCR / Извлечение текста

Анализ графиков

Код со скриншота

Обнаружение объектов

Интерфейс Gradio

API-сервер

Пакетная обработка

Оптимизация памяти

Квантование 4-бит

Выгрузка на CPU (CPU Offload)

Производительность

Модель
GPU
Токенов/с

LLaVA-1.5-7B

RTX 3090

~30

LLaVA-1.5-7B

RTX 4090

~45

LLaVA-1.6-7B

RTX 4090

~40

LLaVA-1.5-13B

A100

~35

Устранение неполадок

Недостаточно памяти

Медленная генерация

  • Использовать flash attention

  • Уменьшить max_new_tokens

  • Использовать квантизированную модель

Плохое качество

  • Используйте модель побольше

  • Лучшие подсказки с контекстом

  • Изображения более высокого разрешения

Оценка стоимости

Типичные ставки на маркетплейсе CLORE.AI (по состоянию на 2024):

GPU
Почасовая ставка
Дневная ставка
Сессия 4 часа

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Цены варьируются в зависимости от провайдера и спроса. Проверьте CLORE.AI Marketplacearrow-up-right для текущих тарифов.

Экономьте деньги:

  • Используйте Spot рынок для гибких рабочих нагрузок (часто на 30–50% дешевле)

  • Платите с помощью CLORE токенов

  • Сравнивайте цены у разных провайдеров

Дальнейшие шаги

  • LLMы Ollama — Запуск LLaVA с Ollama

  • RAG + LangChain — Зрение + RAG

  • vLLM Inference - Продакшен-сервинг

Последнее обновление

Это было полезно?