Ouvrir WebUI

Interface de type ChatGPT pour exécuter des LLMs sur les GPU Clore.ai

Interface élégante de type ChatGPT pour exécuter des LLMs sur les GPU de CLORE.AI.

Tous les exemples peuvent être exécutés sur des serveurs GPU loués via CLORE.AI Marketplace.

Pourquoi Open WebUI ?

Interface de type ChatGPT - Interface familière et soignée
Multi-modèle - Basculer facilement entre les modèles
RAG intégré - Téléversez des documents pour le contexte
Gestion des utilisateurs - Prise en charge multi-utilisateurs
Historique - Persistance des conversations
Intégration Ollama - Fonctionne dès la sortie de l’emballage

Déploiement rapide sur CLORE.AI

Image Docker :

ghcr.io/open-webui/open-webui:cuda

Ports :

22/tcp
8080/http

Commande :

# Démarrer Ollama en arrière-plan
ollama serve &
sleep 5
ollama pull llama3.2

# Démarrer Open WebUI (se connecte automatiquement à Ollama)
# Remarque : l'image Docker gère cela

Accéder à votre service

Après le déploiement, trouvez votre http_pub URL dans Mes commandes:

Aller à la Mes commandes page
Cliquez sur votre commande
Trouvez l' http_pub URL (par ex., abc123.clorecloud.net)

Utilisez https://VOTRE_HTTP_PUB_URL au lieu de localhost dans les exemples ci-dessous.

Vérifiez que cela fonctionne

# Vérifier la santé
curl https://your-http-pub.clorecloud.net/health

# Obtenir la version
curl https://your-http-pub.clorecloud.net/api/version

Réponse :

{"version": "0.7.2"}

Si vous obtenez HTTP 502, attendez 1-2 minutes - le service est encore en cours de démarrage.

Installation

Avec Ollama (Recommandé)

# Démarrer d'abord Ollama
docker run -d --gpus all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

# Récupérer un modèle
docker exec -it ollama ollama pull llama3.2

# Démarrer Open WebUI
docker run -d -p 8080:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

Tout-en-un (Ollama inclus)

docker run -d -p 8080:8080 \
  --gpus all \
  -v ollama:/root/.ollama \
  -v open-webui:/app/backend/data \
  --name open-webui \
  ghcr.io/open-webui/open-webui:ollama

Premier démarrage

Ouvrir http://votre-serveur:8080
Créez un compte administrateur (le premier utilisateur devient administrateur)
Allez dans Paramètres → Modèles → Télécharger un modèle
Commencez à discuter !

Fonctionnalités

Interface de discussion

Rendu Markdown
Surlignage de code
Génération d’images (avec modèles compatibles)
Entrée/sortie vocale
Pièces jointes de fichiers

Gestion des modèles

Télécharger des modèles directement depuis l’interface
Créer des modèles personnalisés
Définir le modèle par défaut
Paramètres spécifiques au modèle

RAG (Discussion de documents)

Cliquez sur "+" dans le chat
Téléversez des PDF, TXT ou d’autres documents
Posez des questions sur le contenu

Gestion des utilisateurs

Utilisateurs multiples
Contrôle d’accès par rôle
Gestion des clés API
Suivi de l’utilisation

Configuration

Variables d'environnement

docker run -d \
  -e OLLAMA_BASE_URL=http://ollama:11434 \
  -e WEBUI_AUTH=True \
  -e WEBUI_NAME="My AI Chat" \
  -e DEFAULT_MODELS="llama3.2" \
  ghcr.io/open-webui/open-webui:main

Paramètres clés

Variable

Description

Par défaut

OLLAMA_BASE_URL

URL de l’API Ollama

http://localhost:11434

WEBUI_AUTH

Activer l’authentification

True

WEBUI_NAME

Nom de l’instance

Ouvrir WebUI

DEFAULT_MODELS

Modèle par défaut

ENABLE_RAG_WEB_SEARCH

Recherche Web dans RAG

False

Se connecter à un Ollama distant

docker run -d -p 8080:8080 \
  -e OLLAMA_BASE_URL=http://remote-server:11434 \
  ghcr.io/open-webui/open-webui:main

Docker Compose

version : '3.8'

services :
  ollama:
    image: ollama/ollama
    container_name: ollama
    volumes :
      - ollama:/root/.ollama
    ports :
      - "11434:11434"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    container_name: open-webui
    volumes :
      - open-webui:/app/backend/data
    ports :
      - "8080:8080"
    environment :
      - OLLAMA_BASE_URL=http://ollama:11434
    depends_on :
      - ollama

volumes :
  ollama:
  open-webui:

docker-compose up -d

Référence API

Open WebUI fournit plusieurs points de terminaison API :

Point de terminaison

Méthode

Description

/health

GET

Vérification de l'état

/api/version

GET

Obtenir la version d’Open WebUI

/api/config

GET

Obtenir la configuration

/ollama/api/tags

GET

Lister les modèles Ollama (proxy)

/ollama/api/chat

POST

Discuter avec Ollama (proxy)

Vérifier la santé

curl https://your-http-pub.clorecloud.net/health

Réponse : true

Obtenir la version

curl https://your-http-pub.clorecloud.net/api/version

Réponse :

{"version": "0.7.2"}

Lister les modèles (via le proxy Ollama)

curl https://your-http-pub.clorecloud.net/ollama/api/tags

La plupart des opérations API nécessitent une authentification. Utilisez l’interface web pour créer un compte et gérer les clés API.

Conseils

Réponses plus rapides

Utilisez des modèles quantifiés (Q4_K_M)
Activez le streaming dans les paramètres
Réduisez la longueur du contexte si nécessaire

Meilleure qualité

Utilisez des modèles plus grands (13B+)
Utilisez la quantification Q8
Ajustez la température dans les paramètres du modèle

Économiser des ressources

Définir OLLAMA_KEEP_ALIVE=5m
Décharger les modèles inutilisés
Utilisez des modèles plus petits pour les tests

Exigences GPU

Identique à composant Ollama.

Open WebUI lui‑même utilise des ressources minimales (~500 Mo de RAM).

Dépannage

Impossible de se connecter à Ollama

# Vérifiez qu’Ollama est en cours d’exécution
curl http://localhost:11434/api/tags

# Si vous utilisez Docker, utilisez le réseau hôte ou l’URL correcte
docker run --network=host ghcr.io/open-webui/open-webui:main

Les modèles n’apparaissent pas

Vérifiez la connexion à Ollama dans les Paramètres
Actualisez la liste des modèles
Téléchargez des modèles via la CLI : ollama pull modelname

Performance lente

Vérifiez que le GPU est utilisé : nvidia-smi
Essayez des modèles plus petits/quantifiés
Réduisez le nombre d’utilisateurs concurrents

Estimation des coûts

Configuration

GPU

Horaire (Hourly)

Basique (7B)

RTX 3060

~$0.03

Standard (13B)

RTX 3090

~$0.06

Avancé (34B)

RTX 4090

~$0.10

Entreprise (70B)

A100

~$0.17

Prochaines étapes

composant Ollama - Utilisation CLI
LocalAI - Plus de backends
RAG + LangChain - RAG avancé

PrécédentOllama SuivantvLLM

Mis à jour il y a 21 jours

Ce contenu vous a-t-il été utile ?

hashtagPourquoi Open WebUI ?

hashtagDéploiement rapide sur CLORE.AI

hashtagAccéder à votre service

hashtagVérifiez que cela fonctionne

hashtagInstallation

hashtagAvec Ollama (Recommandé)

hashtagTout-en-un (Ollama inclus)

hashtagPremier démarrage

hashtagFonctionnalités

hashtagInterface de discussion

hashtagGestion des modèles

hashtagRAG (Discussion de documents)

hashtagGestion des utilisateurs

hashtagConfiguration

hashtagVariables d'environnement

hashtagParamètres clés

hashtagSe connecter à un Ollama distant

hashtagDocker Compose

hashtagRéférence API

hashtagVérifier la santé

hashtagObtenir la version

hashtagLister les modèles (via le proxy Ollama)

hashtagConseils

hashtagRéponses plus rapides

hashtagMeilleure qualité

hashtagÉconomiser des ressources

hashtagExigences GPU

hashtagDépannage

hashtagImpossible de se connecter à Ollama

hashtagLes modèles n’apparaissent pas

hashtagPerformance lente

hashtagEstimation des coûts

hashtagProchaines étapes

Pourquoi Open WebUI ?

Déploiement rapide sur CLORE.AI

Accéder à votre service

Vérifiez que cela fonctionne

Installation

Avec Ollama (Recommandé)

Tout-en-un (Ollama inclus)

Premier démarrage

Fonctionnalités

Interface de discussion

Gestion des modèles

RAG (Discussion de documents)

Gestion des utilisateurs

Configuration

Variables d'environnement

Paramètres clés

Se connecter à un Ollama distant

Docker Compose

Référence API

Vérifier la santé

Obtenir la version

Lister les modèles (via le proxy Ollama)

Conseils

Réponses plus rapides

Meilleure qualité

Économiser des ressources

Exigences GPU

Dépannage

Impossible de se connecter à Ollama

Les modèles n’apparaissent pas

Performance lente

Estimation des coûts

Prochaines étapes