LibreChat — поддержка нескольких провайдеров

Разверните LibreChat на Clore.ai — мощная самохостинговая альтернатива ChatGPT с поддержкой нескольких провайдеров ИИ, ветвлением разговоров и экосистемой плагинов на доступной GPU-инфраструктуре.

Обзор

LibreChatarrow-up-right является улучшенным интерфейсом с открытым исходным кодом, похожим на ChatGPT, с более чем 22K звёздами на GitHub. Он достоверно переосмысляет опыт ChatGPT, добавляя функции, которых не хватает оригиналу — переключение между провайдерами в рамках одного разговора, ветвление/форк разговоров, богатая система плагинов, загрузка файлов с возможностью анализа изображений и полноценная песочница интерпретатора кода.

Почему запускать LibreChat на Clore.ai?

  • Истинная многопровайдерность в одном интерфейсе — Переключайтесь между GPT-4, Claude 3.5, Gemini Pro, Mistral и локальными моделями Ollama в середине сессии.

  • Для приложения GPU не нужен — LibreChat — это приложение на Node.js; вычисления для инференса требуются только если вы подключаете локальный бэкенд LLM.

  • Экономичное самостоятельное хостинг — Тарифы Clore.ai начинаются с долей цента за минуту, что идеально подходит для запуска личного AI-хаба.

  • Постоянные разговоры — MongoDB хранит всю историю чатов на сервере, в отличие от решений, сохраняющих данные только в браузере.

  • Дружественно для команд — Поддержка нескольких пользователей с управлением индивидуальными API-ключами.

Ключевые особенности

Функция
Описание

Многопровайдерность

OpenAI, Anthropic, Google, Azure, Mistral, Ollama, OpenRouter

Ветвление разговоров

Форк и исследование альтернативных ответов

Плагины

Bing search, Zapier, WolframAlpha, пользовательские инструменты

Загрузка файлов

Изображения, PDF, документы с визуальным анализом

Интерпретатор кода

Выполняйте Python в изолированной песочнице

Артефакты

Рендеринг HTML, React и Markdown-выводов

Пресеты

Сохраняйте и делитесь пользовательскими конфигурациями моделей


Требования

Спецификации сервера

Компонент
Минимум
Рекомендуется
Примечания

GPU

Не требуется

RTX 3090 (если добавляете Ollama)

Только для локального инференса LLM

VRAM

24 ГБ

Для локальных моделей через Ollama

CPU

2 vCPU

4 vCPU

Node.js + MongoDB

ОЗУ

4 ГБ

8 ГБ

MongoDB выигрывает от большего объёма оперативной памяти

Хранилище

20 ГБ

50+ ГБ

Загрузка файлов, кэш моделей если локально

Справка по ценам Clore.ai

Тип сервера
Примерная стоимость
Случай использования

Ориентировано на CPU (4 vCPU, 8 ГБ RAM)

~$0.05–0.10/час

LibreChat + внешние API-провайдеры

RTX 3090 (24 ГБ VRAM)

≈ $0.20/ч

LibreChat + локальный инференс через Ollama

RTX 4090 (24 ГБ VRAM)

≈ $0.35/ч

LibreChat + более быстрые Ollama/vLLM

A100 80 GB

≈ $1.10/ч

LibreChat + большие модели 70B+

💡 Совет по стоимости: Если вы используете LibreChat только для маршрутизации API-вызовов к OpenAI/Anthropic/Google, вы платите только за вычисления сервера Clore.ai (дёшево), а не за оборудование для инференса. Заложите в бюджет примерно $0.05–0.15/ч для надёжного хоста LibreChat.

Требования

  • Сервер Clore.ai с доступом по SSH

  • Docker + Docker Compose (предустановлены на Clore.ai)

  • Git (предустановлен на Clore.ai)

  • По крайней мере один API-ключ LLM или локальный бэкенд Ollama/vLLM


Быстрый старт

Метод 1: Docker Compose (Официальный — Рекомендуется)

Официальное развертывание LibreChat использует Docker Compose с MongoDB и MeiliSearch для полной функциональности.

Шаг 1: Подключитесь к вашему серверу Clore.ai

Шаг 2: Клонируйте репозиторий

Шаг 3: Настройте окружение

Установите как минимум:

Быстрая генерация секретов:

Шаг 4: Запустите стек

Это запустит:

  • LibreChat — основное приложение на порту 3080

  • MongoDB — хранение разговоров и пользователей

  • MeiliSearch — быстрый поиск по разговорам

Шаг 5: Проверьте и получите доступ

Откройте в браузере:

Зарегистрируйте новую учётную запись на странице входа.


Метод 2: Предсобранный Docker-образ (Самый быстрый)

Если хотите пропустить сборку из исходников:


Метод 3: Быстрый тест в одном контейнере

Для быстрой демонстрации без MongoDB (ограниченная функциональность):

⚠️ Этот метод требует отдельного экземпляра MongoDB. Используйте Метод 1 для полного развертывания.


Конфигурация

Добавление AI-провайдеров

Редактировать librechat.yaml (создайте его в корне проекта) для расширенной конфигурации провайдеров:

Подмонтируйте этот файл в ваш docker-compose.yml:

Справочник переменных окружения

Переменная
Описание
Пример

MONGO_URI

Строка подключения к MongoDB

mongodb://mongodb:27017/LibreChat

JWT_SECRET

Секрет для подписи JWT (64+ символа)

Случайная hex-строка

OPENAI_API_KEY

Ключ OpenAI

sk-...

ANTHROPIC_API_KEY

Ключ Anthropic

sk-ant-...

GOOGLE_KEY

Ключ Google Gemini

AI...

ALLOW_REGISTRATION

Разрешить публичную регистрацию

true / false

ALLOW_EMAIL_LOGIN

Разрешить вход по email/паролю

true

DEBUG_LOGGING

Подробные логи

true

SEARCH

Включить MeiliSearch

true

MEILI_MASTER_KEY

API-ключ MeiliSearch

Случайная строка

Ограничение регистрации

Для приватного использования отключите публичную регистрацию после создания вашей учётной записи:

Затем перезапустите: docker compose restart LibreChat

Включение интерпретатора кода

Интерпретатор кода запускает Python в изолированном Docker-контейнере. Убедитесь, что Docker-сокет доступен.

Конфигурация загрузки файлов


Ускорение с помощью GPU

LibreChat не не использует GPU напрямую — это слой маршрутизации. Ускорение на GPU применяется к любому локальному бэкенду инференса, который вы подключаете.

Подключение к Ollama (на том же сервере)

Если запускаете Ollama на том же сервере Clore.ai (см. Руководство по Ollama):

Подключение к vLLM (высокая пропускная способность)

Для развертываний с высокой конкурентностью (см. Руководство по vLLM):

В librechat.yaml:

Требования к GPU для локальных моделей

Размер модели
Мин. VRAM
Рекомендуемый GPU Clore
Примерная стоимость

7–8B (Q4)

6 GB

RTX 3090

≈ $0.20/ч

13B (Q4)

10 ГБ

RTX 3090

≈ $0.20/ч

34B (Q4)

24 ГБ

RTX 4090

≈ $0.35/ч

70B (Q4)

48 GB

2× RTX 3090

~$0.40/ч

70B (FP16)

80 ГБ

A100 80GB

≈ $1.10/ч


Подсказки и лучшие практики

Управление затратами на Clore.ai

Стратегия резервного копирования

Восстановление из резервной копии

Обеспечение безопасности LibreChat

  • Всегда устанавливайте сильные уникальные значения для JWT_SECRET и CREDS_KEY

  • Отключите регистрацию после создания первоначального пользователя: ALLOW_REGISTRATION=false

  • Используйте обратный прокси (nginx/Caddy) с HTTPS для продакшена

  • Регулярно обновляйте Docker-образ: docker compose pull && docker compose up -d

Обратный прокси Nginx (опционально)


Устранение неполадок

Порт 3080 недоступен

Подключение к MongoDB отклонено

Ошибки JWT / аутентификации

Модели Ollama не отображаются

Закончилась дисковая память

Обновление до последней версии


Дополнительное чтение

Последнее обновление

Это было полезно?