Hunyuan3D 2.1

Générez des maillages 3D à partir de texte ou d'images avec Tencent Hunyuan3D 2.1 sur Clore.ai

Hunyuan3D 2.1 de Tencent est un modèle de génération 3D en deux étapes : il prédit d'abord la géométrie (forme), puis synthétise des textures PBR. Il accepte à la fois des invites textuelles et des images de référence en entrée et produit des maillages prêts pour la production aux formats GLB, OBJ ou PLY. Avec plus de 3 millions de téléchargements sur HuggingFace, c'est l'un des modèles de génération 3D open-source les plus largement adoptés.

circle-check

Principales caractéristiques

  • Texte en 3D et image en 3D — les deux modes d'entrée dans un seul modèle

  • Pipeline en deux étapes — génération de la forme suivie de la synthèse de textures PBR

  • Sortie haute fidélité — géométrie détaillée avec cartes d'albédo, normales et rugosité

  • Formats d'export multiples — GLB, OBJ, PLY

  • Interface web Gradio — interaction via le navigateur, aucun codage requis

  • 16–24 GB VRAM — fonctionne sur RTX 3090 et RTX 4090

  • 3M+ téléchargements sur HuggingFace — communauté active et mises à jour continues

Exigences

Composant
Minimum
Recommandé

GPU

RTX 3090 24 GB

RTX 4090 24 Go

VRAM

16 Go

24 Go

RAM

16 Go

32 Go

Disque

50 Go

100 Go

CUDA

11.8

12.1+

Python

3.10

3.11

Tarifs Clore.ai : RTX 4090 ≈ 0,5–2 $/jour · RTX 3090 ≈ 0,3–1 $/jour

Démarrage rapide

1. Cloner et installer

2. Lancer l'interface web Gradio

L'interface propose :

  • Champ de saisie textuelle pour la génération texte→3D

  • Téléversement d'image pour la génération image→3D

  • Curseurs pour les étapes d'inférence, l'échelle de guidage et la graine

  • Aperçu du modèle 3D avec contrôles d'orbite

  • Boutons de téléchargement pour GLB/OBJ/PLY

3. Générer via l'API Python

4. Ajouter des textures (Étape 2)

Exemples d'utilisation

Génération image→3D

Traitement par lots

Exporter vers plusieurs formats

Référence de performance

GPU
Forme (30 étapes)
Texture (20 étapes)
Total

RTX 4090

~20 s

~15 s

~35 s

RTX 3090

~30 s

~25 sec

~55 s

A100 40G

~18 s

~12 s

~30 s

Conseils

  • Supprimer les arrière-plans d'image avant image→3D — utiliser rembg pour une segmentation propre

  • Les invites textuelles bénéficient de la spécificité — "une épée médiévale low-poly avec poignée en cuir" produit de meilleurs résultats que "épée"

  • Réduire num_inference_steps à 15–20 pour des aperçus plus rapides pendant l'itération

  • Augmentez guidance_scale (8–12) pour une adhérence plus forte à l'invite au prix de la diversité

  • GLB est le meilleur format d'export — il regroupe géométrie, textures et matériaux dans un seul fichier

  • Utilisez --share lors du lancement de Gradio sur Clore.ai pour un accès distant via navigateur

  • Les poids du modèle font ~15 Go — assurez-vous d'avoir suffisamment d'espace disque avant le premier lancement

  • Pour les assets de jeu, générez en haute qualité puis décimatez dans Blender pour les niveaux de LOD

Dépannage

Problème
Solution

CUDA out of memory

Utilisez RTX 3090+ (24 GB). Réduisez la taille de lot ou les étapes d'inférence

Le téléchargement du modèle bloque

Vérifiez l'espace disque. Utilisez huggingface-cli download tencent/Hunyuan3D-2 manuellement

Interface Gradio inaccessible

Passer --share le drapeau, ou rediriger le port 7860 depuis le tableau de bord Clore.ai

Qualité de géométrie médiocre

Augmentez num_inference_steps à 40+, essayez d'autres graines

Artéfacts de texture

Assurez-vous que le maillage de la forme est propre avant l'étape de texture

Erreurs d'import sur une installation fraîche

Exécutez pip install -r requirements.txt à nouveau — certaines dépendances se compilent depuis les sources

Génération lente au premier lancement

Attendu — la compilation du modèle et le chargement des poids sont mis en cache après la première inférence

Ressources

Mis à jour

Ce contenu vous a-t-il été utile ?