Hunyuan3D 2.1

Clore.ai पर Tencent Hunyuan3D 2.1 के साथ टेक्स्ट या इमेज से 3D मेष जेनरेट करें

Tencent द्वारा Hunyuan3D 2.1 एक दो-चरणीय 3D जनरेशन मॉडल है: यह पहले ज्यामिति (आकार) का पूर्वानुमान लगाता है, फिर PBR टेक्सचर संश्लेषित करता है। यह टेक्स्ट प्रॉम्प्ट और संदर्भ छवियों दोनों को इनपुट के रूप में स्वीकार करता है और GLB, OBJ, या PLY फॉर्मेट में प्रोडक्शन-रेडी मेष आउटपुट करता है। HuggingFace पर 3 मिलियन से अधिक डाउनलोड के साथ, यह सबसे व्यापक रूप से अपनाए गए ओपन-सोर्स 3D जनरेशन मॉडलों में से एक है।

circle-check

प्रमुख विशेषताएँ

  • टेक्स्ट-टू-3D और इमेज-टू-3D — दोनों इनपुट मोड एक ही मॉडल में

  • दो-चरण पाइपलाइन — पहले आकृति जनरेशन फिर PBR टेक्सचर संश्लेषण

  • उच्च-विश्वसनीयता आउटपुट — अल्बेडो, नॉर्मल और रफनेस मैप के साथ विस्तृत ज्यामिति

  • कई एक्सपोर्ट फॉर्मेट — GLB, OBJ, PLY

  • Gradio वेब UI — ब्राउज़र-आधारित इंटरैक्शन, किसी कोडिंग की आवश्यकता नहीं

  • 16–24 GB VRAM — RTX 3090 और RTX 4090 पर चलता है

  • 3M+ डाउनलोड HuggingFace पर — सक्रिय समुदाय और निरंतर अपडेट

आवश्यकताएँ

घटक
न्यूनतम
अनुशंसित

GPU

RTX 3090 24 GB

RTX 4090 24 GB

VRAM

16 GB

24 GB

RAM

16 GB

32 GB

डिस्क

50 GB

100 GB

CUDA

11.8

12.1+

Python

3.10

3.11

Clore.ai मूल्य निर्धारण: RTX 4090 ≈ $0.5–2/दिन · RTX 3090 ≈ $0.3–1/दिन

त्वरित प्रारम्भ

1. क्लोन और इंस्टॉल करें

2. Gradio वेब UI लॉन्च करें

UI प्रदान करता है:

  • टेक्स्ट-टू-3D जनरेशन के लिए टेक्स्ट इनपुट फ़ील्ड

  • इमेज-टू-3D जनरेशन के लिए इमेज अपलोड

  • इन्फेरेंस स्टेप्स, गाइडेंस स्केल और सीड के लिए स्लाइडर

  • ऑर्बिट कंट्रोल के साथ 3D मॉडल प्रीव्यू

  • GLB/OBJ/PLY के लिए डाउनलोड बटन

3. Python API के माध्यम से जनरेट करें

4. टेक्सचर जोड़ें (चरण 2)

उपयोग के उदाहरण

इमेज-टू-3D जनरेशन

बैच प्रोसेसिंग

कई फॉर्मैट में एक्सपोर्ट करें

प्रदर्शन संदर्भ

GPU
आकृति (30 स्टेप्स)
टेक्सचर (20 स्टेप्स)
कुल

RTX 4090

~20 सेकंड

~15 सेकंड

~35 सेकंड

RTX 3090

~30 सेकंड

~25 सेकंड

~55 सेकंड

A100 40G

~18 सेकंड

~12 सेकंड

~30 सेकंड

टिप्स

  • छवि पृष्ठभूमि निकालें इमेज-टू-3D से पहले — उपयोग करें rembg साफ सेगमेंटेशन के लिए

  • टेक्स्ट प्रॉम्प्ट्स specificity से लाभान्वित होते हैं — "a low-poly medieval sword with leather-wrapped handle" "sword" की तुलना में बेहतर परिणाम देता है

  • कम करें num_inference_steps तेज प्रीव्यू के लिए इटरेशन के दौरान 15–20 पर

  • बढ़ाएँ guidance_scale (8–12) बेहतर प्रॉम्प्ट पालन के लिए, विविधता के खर्च पर

  • GLB सबसे अच्छा एक्सपोर्ट फॉर्मैट है — यह ज्यामिति, टेक्सचर और मैटेरियल को एक ही फ़ाइल में बंडल करता है

  • उपयोग करें --share Clore.ai पर Gradio लॉन्च करते समय दूरस्थ ब्राउज़र एक्सेस के लिए

  • मॉडल वेट्स ~15 GB हैं — पहली बार रन से पहले पर्याप्त डिस्क स्थान सुनिश्चित करें

  • गेम एसेट्स के लिए, उच्च गुणवत्ता में जनरेट करें फिर LOD स्तरों के लिए Blender में डेसिमेट करें

समस्याओं का निवारण

समस्या
समाधान

CUDA में आउट ऑफ मेमोरी

RTX 3090+ (24 GB) का उपयोग करें। बैच साइज या इन्फेरेंस स्टेप्स कम करें

मॉडल डाउनलोड अटके हुए

डिस्क स्पेस चेक करें। उपयोग करें huggingface-cli download tencent/Hunyuan3D-2 मैन्युअली

Gradio UI पहुँच योग्य नहीं

फ्लैग पास करें --share या Clore.ai डैशबोर्ड से पोर्ट 7860 फॉरवर्ड करें

खराब ज्यामिति गुणवत्ता

बढ़ाएँ num_inference_steps 40+ पर जाएं, अलग सीड आज़माएँ

टेक्सचर आर्टिफैक्ट्स

टेक्सचर चरण से पहले सुनिश्चित करें कि आकृति मेष साफ है

ताज़ी इंस्टॉल पर इम्पोर्ट त्रुटियां

चलाएँ pip install -r requirements.txt फिर से — कुछ डिप्स स्रोत से कम्पाइल होते हैं

पहली रन पर धीमा जनरेशन

अपेक्षित — मॉडल कम्पाइलेशन और वेट लोडिंग पहली इन्फेरेंस के बाद कैश हो जाती है

संसाधन

Last updated

Was this helpful?