> For the complete documentation index, see [llms.txt](https://docs.clore.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.clore.ai/guides/guides_v2-hi/3d-generation/hunyuan-world-2.md).

# Hunyuan World 2.0 (3D वर्ल्ड मॉडल)

{% hint style="info" %}
**15 अप्रैल, 2026 को जारी किया गया** — Tencent Hunyuan जारी किया गया **HY-World 2.0**, पहला पूरी तरह ओपन-सोर्स SOTA 3D वर्ल्ड मॉडल। यह गाइड शामिल करती है **WorldMirror 2.0** (शिप किया गया \~1.2B पैरामीटर पुनर्निर्माण घटक)। सहायक मॉडल **HY-Pano 2.0** और **WorldStereo 2.0** को आधिकारिक रिपो में "जल्द आ रहा है" के रूप में चिह्नित किया गया है — देखें [रोडमैप](#roadmap) नीचे।
{% endhint %}

HY-World 2.0 Tencent का मल्टी-मॉडल वर्ल्ड-मॉडल फ्रेमवर्क है **पूर्ण 3D दृश्यों का पुनर्निर्माण, निर्माण और सिमुलेशन करने के लिए**. एकल-ऑब्जेक्ट मेष जनरेटरों के विपरीत, HY-World टेक्स्ट, एकल या मल्टी-व्यू इमेज, या वीडियो को इनपुट करता है और संपादन योग्य वर्ल्ड रिप्रेज़ेंटेशन आउटपुट करता है — मेष, 3D Gaussian Splats, पॉइंट क्लाउड, डेप्थ मैप, सतह नॉर्मल, और पुनर्प्राप्त कैमरा पैरामीटर — जो Unity, Unreal, या Blender में सीधे उपयोग के लिए तैयार होते हैं।

पहले सार्वजनिक वेट्स शामिल करते हैं **WorldMirror 2.0** (\~1.2B पैरामीटर, BF16) — स्टैक का पुनर्निर्माण आधा। यह एकल GPU पर लगभग 12–24 GB VRAM में चलता है और 50K से 500K पिक्सल तक लचीला रेज़ोल्यूशन सपोर्ट करता है, साथ ही बड़े वर्कलोड के लिए FSDP मल्टी-GPU शार्डिंग भी। एक Python API (`diffusers`-शैली), CLI via `torchrun`, और एक Gradio डेमो डिफ़ॉल्ट रूप से उपलब्ध हैं। एक ComfyUI नोड **नहीं** अभी आधिकारिक है — केवल कम्युनिटी पोर्ट्स।

{% hint style="success" %}
इस गाइड के सभी उदाहरण [CLORE.AI Marketplace](https://clore.ai/marketplace).
{% endhint %}

### के माध्यम से किराए पर लिए गए GPU सर्वरों पर चलते हैं

| गुण              | मान                                                                          |
| ---------------- | ---------------------------------------------------------------------------- |
| घटक              | WorldMirror 2.0 (शिप किया गया); HY-Pano 2.0 + WorldStereo 2.0 जल्द आ रहे हैं |
| पैरामीटर         | \~1.2B (BF16)                                                                |
| इनपुट मोडैलिटी   | टेक्स्ट · सिंगल-व्यू इमेज · मल्टी-व्यू इमेज · वीडियो                         |
| आउटपुट           | मेष · 3D Gaussian Splat · पॉइंट क्लाउड · डेप्थ · नॉर्मल्स · कैमरा पैरामीटर   |
| VRAM             | \~12–24 GB एकल GPU; मल्टी-GPU के लिए FSDP                                    |
| रेज़ोल्यूशन रेंज | 50K – 500K पिक्सल (फ्लेक्स-रेज़)                                             |
| लाइसेंस          | `tencent-hy-world-2.0-community` (कस्टम — नीचे देखें)                        |
| रिलीज़           | 2026-04-15                                                                   |

{% hint style="warning" %}
**लाइसेंस संबंधी सावधानी:** HY-World 2.0 एक कस्टम कम्युनिटी लाइसेंस के तहत शिप किया गया है (`License.txt` रिपो रूट पर), **नहीं** Apache 2.0 या MIT। व्यावसायिक उपयोग की शर्तें Tencent के Hunyuan3D 2.1 से अलग हैं। उस पर आधारित कुछ भी शिप करने से पहले पूरा लाइसेंस पढ़ें।
{% endhint %}

### HY-World 2.0 क्यों?

* **पहला ओपन-सोर्स SOTA वर्ल्ड मॉडल** — इस श्रेणी में कोई क्लोज़्ड प्रतियोगी नहीं
* **सिर्फ मेष नहीं, पूरा सीन आउटपुट** — Gaussian Splats + ज्योमेट्री + कैमरा एक ही पास में
* **मल्टी-मॉडल इनपुट** — वही पाइपलाइन टेक्स्ट, इमेज और वीडियो को संभालती है
* **FSDP-रेडी** — उच्च-रेज़ या बैच्ड इन्फ़रेंस के लिए 2–8 GPUs में स्केल करें
* **गेम-इंजन-रेडी** — आउटपुट सीधे Unity, Unreal, और Blender में डाले जा सकते हैं

***

## आवश्यकताएँ

| घटक        | न्यूनतम                 | अनुशंसित                          |
| ---------- | ----------------------- | --------------------------------- |
| GPU VRAM   | 16 GB (RTX 4080 / 3090) | 24–80 GB (RTX 4090 / A100 / H100) |
| सिस्टम RAM | 32 GB                   | 64–128 GB                         |
| डिस्क      | 80 GB                   | 200 GB                            |
| CUDA       | 12.1                    | 12.4+                             |
| Python     | 3.10                    | 3.10                              |
| PyTorch    | 2.4.0                   | 2.4.0+                            |

{% hint style="info" %}
मल्टी-GPU मोड के लिए आवश्यक है **प्रति GPU ≥ 1 इनपुट इमेज**. एक संदर्भ इमेज के लिए, एक GPU के साथ ही रहें और FSDP को केवल बैच्ड या उच्च-रेज़ोल्यूशन जॉब्स के लिए सक्रिय होने दें।
{% endhint %}

***

## विकल्प A — Docker + torchrun के साथ क्विकस्टार्ट

एक न्यूनतम `docker-compose.yml` Clore.ai कंटेनर के लिए (आधिकारिक Tencent इमेज अभी प्रकाशित नहीं हुई है — यह PyTorch बेस का उपयोग करती है और रिपो इंस्टॉल को अंदर चलाती है):

```yaml
version: "3.8"
services:
  hyworld2:
    image: pytorch/pytorch:2.4.0-cuda12.4-cudnn9-devel
    ports:
      - "7860:7860"
    volumes:
      - ./workspace:/workspace
      - hf_cache:/root/.cache/huggingface
    working_dir: /workspace
    command: >
      bash -c "
        git clone https://github.com/Tencent-Hunyuan/HY-World-2.0 &&
        cd HY-World-2.0 &&
        pip install -r requirements.txt &&
        pip install flash-attn --no-build-isolation &&
        python -m hyworld2.worldrecon.gradio_app
      "
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]
    shm_size: "16gb"

volumes:
  hf_cache:
```

FSDP और BF16 के साथ मल्टी-GPU पुनर्निर्माण जॉब चलाएँ:

```bash
torchrun --nproc_per_node=2 -m hyworld2.worldrecon.pipeline \\
    --input_path /workspace/input_images \\
    --use_fsdp --enable_bf16
```

***

## विकल्प B — मैनुअल Python API

```bash
# क्लोन और इंस्टॉल करें
git clone https://github.com/Tencent-Hunyuan/HY-World-2.0
cd HY-World-2.0
conda create -n hyworld2 python=3.10 -y
conda activate hyworld2
pip install torch==2.4.0 torchvision==0.19.0 --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt
pip install flash-attn --no-build-isolation
```

```python
from hyworld2.worldrecon.pipeline import WorldMirrorPipeline

# HF (tencent/HY-World-2.0) से लगभग ~1.2B BF16 वेट्स लोड करता है
pipeline = WorldMirrorPipeline.from_pretrained('tencent/HY-World-2.0')

# मल्टी-व्यू इमेज के फ़ोल्डर से 3D सीन का पुनर्निर्माण करें
result = pipeline('path/to/images')

# वैकल्पिक: अधिक सटीक पुनर्निर्माण के लिए पूर्व कैमरा + डेप्थ डालें
result = pipeline(
    'path/to/images',
    prior_cam_path='path/to/prior_camera.json',
    prior_depth_path='path/to/prior_depth/',
)
```

Gradio डेमो को पोर्ट 7860 पर लॉन्च करें:

```bash
python -m hyworld2.worldrecon.gradio_app
```

FSDP के साथ मल्टी-GPU Gradio के लिए:

```bash
torchrun --nproc_per_node=2 -m hyworld2.worldrecon.gradio_app \\
    --use_fsdp --enable_bf16
```

***

## Clore.ai GPU अनुशंसाएँ

| वर्कलोड                            | GPU        | VRAM       | क्यों                                      | Clore.ai लागत |
| ---------------------------------- | ---------- | ---------- | ------------------------------------------ | ------------- |
| एकल इमेज → सीन, डेवलपमेंट/प्रीव्यू | RTX 4090   | 24 GB      | BF16 आराम से फिट होता है, तेज़ iteration   | \~$0.5–2/दिन  |
| मल्टी-व्यू वीडियो पुनर्निर्माण     | A100 40 GB | 40 GB      | 200K+ पिक्सल फ़्रेम बिना OOM के संभालता है | \~$3–5/दिन    |
| हाई-रेज़ बैच्ड (प्रोडक्शन)         | A100 80 GB | 80 GB      | पूरा 500K पिक्सल फ्लेक्स-रेज़, बड़े बैच    | \~$5–8/दिन    |
| FSDP मल्टी-GPU / शोध               | 2–4× H100  | 160–320 GB | शार्डेड ट्रेनिंग-स्केल वर्कलोड             | \~$15–40/दिन  |

{% hint style="success" %}
**Clore.ai पर सबसे अच्छा विकल्प:** एक अकेला **RTX 4090 लगभग \~$0.5–2/दिन पर** रोज़मर्रा का WorldMirror इन्फ़रेंस संभालता है। >200K-पिक्सल पुनर्निर्माण या लंबे वीडियो इनपुट की ज़रूरत होने पर ही A100 पर जाएँ।
{% endhint %}

***

## उपयोग के मामले

* **गेम डेवलपमेंट** — कॉन्सेप्ट आर्ट को ब्लॉकआउट और ग्रेबॉक्स के लिए रफ़ 3D वातावरण में बदलें
* **AR/VR कंटेंट** — Unity/Unreal में लगभग-फोटोग्राफ़िक निष्ठा के साथ चलने योग्य Gaussian Splat सीन जनरेट करें
* **फ़िल्म और एनीमेशन प्रीविज़** — वर्चुअल सिनेमैटोग्राफ़ी के लिए ऑन-लोकेशन फ़ोटो से सेट्स का पुनर्निर्माण करें
* **आर्किटेक्चरल विज़ुअलाइज़ेशन** — संदर्भ शॉट्स या टेक्स्ट ब्रीफ को संपादन योग्य 3D वॉकथ्रू में बदलें
* **रोबोटिक्स + सिमुलेशन** — विरल वास्तविक-विश्व फुटेज से 3D प्रशिक्षण वातावरण सिंथेसाइज़ करें

***

## रोडमैप

Tencent ने आधिकारिक रिपो में निम्नलिखित को "जल्द आ रहा है" के रूप में सूचीबद्ध किया है:

* **HY-Pano 2.0** — 360° पैनोरमा जनरेशन (अंतरिम: HunyuanWorld 1.0)
* **WorldStereo 2.0** — वर्ल्ड एक्सपैंशन / नोवेल-व्यू सिंथेसिस (अंतरिम: मूल WorldStereo)
* **WorldNav** — सीन traversal के लिए ट्रैजेक्टरी प्लानिंग
* **पूर्ण वर्ल्ड-जनरेशन पाइपलाइन कोड** — टेक्स्ट/इमेज → पूर्ण वर्ल्ड एंट्री पॉइंट

WorldMirror 2.0 (पुनर्निर्माण) आज सार्वजनिक वेट्स वाला एकमात्र घटक है। [HF मॉडल पेज](https://huggingface.co/tencent/HY-World-2.0) पर नज़र रखें, रिलीज़ के लिए।

***

## समस्या-निवारण

| समस्या                                   | समाधान                                                                                                                                        |
| ---------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------- |
| `CUDA out of memory` 16 GB GPU पर        | इनपुट रेज़ोल्यूशन को 50K px तक कम करें, या RTX 4090 (24 GB) पर स्विच करें। सक्षम करें `--enable_bf16`                                         |
| लॉन्च पर FSDP हैंग हो जाता है            | सुनिश्चित करें कि इनपुट इमेज की संख्या **≥** `--nproc_per_node`. FSDP को GPUs के बीच NCCL + मिलती-जुलती CUDA भी चाहिए                         |
| `flash-attn` इंस्टॉल विफल                | प्री-बिल्ट व्हील आज़माएँ `pip install flash-attn --no-build-isolation` CUDA 12.4 पर; अगर फिर भी विफल हो, तो पाइपलाइन इसके बिना (धीमी) चलती है |
| Clore.ai पर Gradio UI उपलब्ध नहीं हो रही | Clore कंटेनर कॉन्फ़िग में पोर्ट 7860 को फ़ॉरवर्ड करें, या इसके साथ लॉन्च करें `--share`                                                       |
| व्यावसायिक उपयोग के लिए लाइसेंस प्रश्न   | पढ़ें `License.txt` रिपो में — यह है `tencent-hy-world-2.0-community`मानक OSS नहीं,                                                           |

***

## अगले चरण

* [Hunyuan3D 2.1](/guides/guides_v2-hi/3d-generation/hunyuan3d.md) — Tencent का सिंगल-ऑब्जेक्ट टेक्स्ट/इमेज-टू-मेष जनरेटर (छोटा, Apache-शैली पाइपलाइन, अलग उपयोग मामला)
* [TRELLIS 3D](/guides/guides_v2-hi/3d-generation/trellis-3d.md) — Microsoft का संरचित 3D एसेट जनरेटर
* [Gaussian Splatting](/guides/guides_v2-hi/3d-generation/gaussian-splatting.md) — HY-World द्वारा उत्पन्न 3DGS आउटपुट के लिए रेंडर पाइपलाइन
* [HuggingFace मॉडल](https://huggingface.co/tencent/HY-World-2.0)
* [GitHub रिपो](https://github.com/Tencent-Hunyuan/HY-World-2.0)
* [CLORE.AI Marketplace](https://clore.ai/marketplace)


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-hi/3d-generation/hunyuan-world-2.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
