Hunyuan3D 2.1

Generieren Sie 3D-Meshes aus Text oder Bildern mit Tencent Hunyuan3D 2.1 auf Clore.ai

Hunyuan3D 2.1 von Tencent ist ein zweistufiges 3D-Generierungsmodell: Es sagt zuerst die Geometrie (Form) voraus und synthetisiert dann PBR-Texturen. Es akzeptiert sowohl Texteingaben als auch Referenzbilder als Eingabe und gibt produktionstaugliche Meshes im GLB-, OBJ- oder PLY-Format aus. Mit über 3 Millionen Downloads auf HuggingFace ist es eines der am weitesten verbreiteten Open-Source-3D-Generierungsmodelle.

circle-check

Hauptmerkmale

  • Text-zu-3D und Bild-zu-3D — beide Eingabemodi in einem einzigen Modell

  • Zweistufige Pipeline — Formgenerierung gefolgt von PBR-Textursynthese

  • Hohe Wiedergabetreue — detaillierte Geometrie mit Albedo-, Normal- und Roughness-Maps

  • Mehrere Exportformate — GLB, OBJ, PLY

  • Gradio Web-UI — browserbasierte Interaktion, kein Programmieraufwand erforderlich

  • 16–24 GB VRAM — läuft auf RTX 3090 und RTX 4090

  • 3M+ Downloads auf HuggingFace — aktive Community und kontinuierliche Updates

Anforderungen

Komponente
Minimum
Empfohlen

GPU

RTX 3090 24 GB

RTX 4090 24 GB

VRAM

16 GB

24 GB

RAM

16 GB

32 GB

Festplatte

50 GB

100 GB

CUDA

11.8

12.1+

Python

3.10

3.11

Clore.ai-Preise: RTX 4090 ≈ $0.5–2/Tag · RTX 3090 ≈ $0.3–1/Tag

Schnellstart

1. Klonen und installieren

2. Die Gradio Web-UI starten

Die UI bietet:

  • Texteingabefeld für Text-zu-3D-Generierung

  • Bild-Upload für Bild-zu-3D-Generierung

  • Schieberegler für Inferenzschritte, Guidance-Scale und Seed

  • 3D-Modellvorschau mit Orbit-Steuerung

  • Download-Buttons für GLB/OBJ/PLY

3. Generierung über die Python-API

4. Texturen hinzufügen (Stufe 2)

Beispielanwendungen

Bild-zu-3D-Generierung

Batch-Verarbeitung

Export in mehrere Formate

Leistungsreferenz

GPU
Form (30 Schritte)
Textur (20 Schritte)
Gesamt

RTX 4090

~20 Sek

~15 Sek

~35 Sek

RTX 3090

~30 Sek.

~25 Sek.

~55 Sek

A100 40G

~18 Sek.

~12 Sek.

~30 Sek.

Tipps

  • Bildhintergründe entfernen vor Bild-zu-3D — verwenden Sie rembg für saubere Segmentierung

  • Text-Prompts profitieren von Spezifizität — "a low-poly medieval sword with leather-wrapped handle" liefert bessere Ergebnisse als "sword"

  • Reduzieren num_inference_steps auf 15–20 für schnellere Vorschauen während der Iteration

  • Erhöhen Sie guidance_scale (8–12) für stärkere Einhaltung des Prompts auf Kosten der Diversität

  • GLB ist das beste Exportformat — es bündelt Geometrie, Texturen und Materialien in einer einzigen Datei

  • Verwenden Sie --share beim Starten von Gradio auf Clore.ai für den entfernten Browserzugriff

  • Modellgewichte sind ~15 GB — stellen Sie vor dem ersten Lauf ausreichend Festplattenspeicher sicher

  • Für Spielassets, erzeugen Sie in hoher Qualität und dezimieren Sie dann in Blender für LOD-Stufen

Fehlerbehebung

Problem
Lösung

CUDA out of memory

Verwenden Sie RTX 3090+ (24 GB). Reduzieren Sie die Batch-Größe oder die Inferenzschritte

Modell-Download stockt

Überprüfen Sie den Festplattenspeicher. Verwenden Sie huggingface-cli download tencent/Hunyuan3D-2 manuell

Gradio-UI nicht erreichbar

Flagge übergeben, --share oder leiten Sie Port 7860 vom Clore.ai-Dashboard weiter

Schlechte Geometriequalität

Erhöhen Sie num_inference_steps auf 40+ erhöhen, versuchen Sie verschiedene Seeds

Texturartefakte

Stellen Sie sicher, dass das Form-Mesh vor der Texturstufe sauber ist

Importfehler bei frischer Installation

Ausführen pip install -r requirements.txt nochmals — einige Abhängigkeiten werden aus dem Quellcode kompiliert

Langsame Generierung beim ersten Lauf

Erwartet — Modellkompilierung und Laden der Gewichte werden nach der ersten Inferenz zwischengespeichert

Ressourcen

Zuletzt aktualisiert

War das hilfreich?