LocalAI
Самохостинговый OpenAI-совместимый API с LocalAI на Clore.ai
Требования к серверу
Параметр
Минимум
Рекомендуется
Что такое LocalAI?
Поддерживаемые модели
Тип
Форматы
Примеры
Быстрое развертывание
Проверьте, что всё работает
Предустановленные модели
Название модели
Тип
Описание
Доступ к вашему сервису
Развертывание в Docker (альтернатива)
Загрузка моделей
Из галереи моделей
С Hugging Face
Конфигурация модели
Использование API
Chat Completions (совместимо с OpenAI)
Потоковая передача (Streaming)
Эмбеддинги
Генерация изображений
Примеры cURL
Чат
Эмбеддинги
Текст в речь (TTS)
Речь в текст (STT)
Перераanking
Полная справочная документация API
Стандартные эндпоинты (совместимые с OpenAI)
Эндпоинт
Метод
Описание
Дополнительные эндпоинты
Эндпоинт
Метод
Описание
Получить версию
Документация Swagger
Ускорение с помощью GPU
CUDA-бэкенд
Полная выгрузка на GPU
Несколько моделей
Настройка производительности
Для скорости
Для экономии памяти
Бенчмарки
Модель
GPU
Токенов/с
Устранение неполадок
HTTP 502 на http_pub URL
Модель не загружается
Медленные ответы
Недостаточно памяти
Проблемы с генерацией изображений
Оценка стоимости
GPU
VRAM
Цена/день
Подходит для
Дальнейшие шаги
Последнее обновление
Это было полезно?