Aphrodite Engine
Exécuter Aphrodite Engine pour l'inférence LLM sur GPU anciens et modernes sur Clore.ai
Exigences serveur
Paramètre
Minimum
Recommandé
Déploiement rapide sur CLORE.AI
Variable
Exemple
Description
Configuration étape par étape
1. Louez un serveur GPU sur CLORE.AI
2. Se connecter via SSH
3. Récupérer l'image Aphrodite Engine
4. Lancer Aphrodite Engine
5. Vérifiez le serveur
6. Accès via le proxy HTTP de CLORE.AI
Exemples d’utilisation
Exemple 1 : Chat compatible OpenAI
Exemple 2 : Échantillonnage avancé avec Mirostat
Exemple 3 : API compatible Kobold
Exemple 4 : Client Python avec échantillonneurs personnalisés
Exemple 5 : Complétions par lots
Configuration
Principaux paramètres de lancement
Paramètre
Par défaut
Description
Ajout de l'authentification par clé API
Chargement de modèles locaux
Conseils de performance
1. Choisissez la bonne quantification pour votre GPU
VRAM GPU
Modèle 7B
Modèle 13B
Modèle 30B
2. Ajustez l'utilisation de la mémoire GPU
3. Utiliser bfloat16 sur les GPU Ampere+
4. Optimiser pour le jeu de rôle / l'écriture créative
5. Conseils pour GPU Pascal (GTX 10xx)
Dépannage
Problème : "capacité CUDA sm_6x non prise en charge"
Problème : "mémoire insuffisante" sur les petits GPU
Problème : génération de tokens lente
Problème : modèle introuvable / erreurs 404
Problème : sortie répétitive
Problème : le conteneur Docker se termine silencieusement
Liens
Recommandations GPU Clore.ai
Cas d’utilisation
GPU recommandé
Coût estimé sur Clore.ai
Mis à jour
Ce contenu vous a-t-il été utile ?