Text Generation WebUI
Exécutez text-generation-webui pour l'inférence LLM sur les GPU Clore.ai
Location sur CLORE.AI
Accédez à votre serveur
Pourquoi Text Generation WebUI ?
Exigences
Taille du modèle
VRAM min
Recommandé
Déploiement rapide
Installation manuelle
Accéder à votre service
Accéder à WebUI
Télécharger des modèles
Depuis HuggingFace (dans WebUI)
Via la ligne de commande
Modèles recommandés
Chargement des modèles
GGUF (Recommandé pour la plupart des utilisateurs)
GPTQ (Rapide, quantifié)
EXL2 (Meilleure vitesse)
Configuration du chat
Configuration du personnage
Mode Instruct
Utilisation de l'API
Activer l'API
API compatible OpenAI
API native
Extensions
Installation des extensions
Activer les extensions
Extensions populaires
Extension
But
Réglage des performances
Paramètres GGUF
Optimisation de la mémoire
Optimisation de la vitesse
Fine-tuning (LoRA)
Onglet d'entraînement
Format du jeu de données
Sauvegarder votre travail
Dépannage
Le modèle ne se charge pas
Génération lente
Estimation des coûts
GPU
Tarif horaire
Tarif journalier
Session de 4 heures
Mis à jour
Ce contenu vous a-t-il été utile ?