> For the complete documentation index, see [llms.txt](https://docs.clore.ai/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.clore.ai/guides/guides_v2-hi/music-generation/ace-step.md).

# ACE-Step Music Generation

ACE-Step 1.5 वह ओपन-सोर्स संगीत जनरेशन ब्रेकथ्रू है जिसका हर कोई इंतज़ार कर रहा था। यह उत्पन्न करता है **वोकल और इंस्ट्रुमेंट के साथ पूर्ण गीत** टेक्स्ट प्रॉम्प्ट से, Suno जैसी वाणिज्यिक सेवाओं का मुकाबला करते हुए — लेकिन आपके GPU पर लोकली चलता है एक **MIT लाइसेंस**। प्रमुख विशेषता? इसे आवश्यकता होती है **4GB से कम VRAM** , जिससे यह अब तक का सबसे सुलभ AI संगीत उपकरण बन जाता है। RTX 4090 पर 2–8 सेकंड में एक पूरा ट्रैक जेनरेट करें।

## प्रमुख विशेषताएँ

* **पूर्ण गीत जेनरेशन**: एक ही पास में वोकल + इंस्ट्रुमेंट + इफेक्ट्स
* **< 4GB VRAM**: यहां तक कि सबसे सस्ते GPUs पर चलता है (RTX 3060, यहां तक कि GTX 1060!)
* **2–8 सेकंड प्रति ट्रैक**: आधुनिक GPUs पर लगभग तात्कालिक जनरेशन
* **MIT लाइसेंस**: पूर्ण वाणिज्यिक उपयोग, कोई प्रतिबंध नहीं
* **गीत लेखन समर्थन**: पद/कोरस संरचना के साथ अपनी स्वयं की लिरिक्स लिखें
* **स्टाइल कंट्रोल**: शैली टैग, मूड, टेम्पो, इंस्ट्रुमेंटेशन
* **ComfyUI इंटीग्रेशन**: जटिल संगीत पाइपलाइनों के लिए नोड-आधारित वर्कफ़्लो

## आवश्यकताएँ

| घटक    | न्यूनतम                     | अनुशंसित          |
| ------ | --------------------------- | ----------------- |
| GPU    | किसी भी में 4GB VRAM के साथ | RTX 3060 या बेहतर |
| VRAM   | 4GB                         | 6GB+              |
| RAM    | 8GB                         | 16GB              |
| डिस्क  | 10GB                        | 15GB              |
| Python | 3.10+                       | 3.11              |

**अनुशंसित Clore.ai GPU**: RTX 3060 6GB (\~$0.15–0.3/दिन) — हाँ, सबसे सस्ता GPU काम करता है!

### स्पीड संदर्भ

| GPU           | जनरेशन समय (30s ट्रैक) |
| ------------- | ---------------------- |
| GTX 1060 6GB  | \~15–20 सेकंड          |
| RTX 3060 12GB | \~6–10 सेकंड           |
| RTX 3080 10GB | \~4–6 सेकंड            |
| RTX 4090 24GB | \~2–3 सेकंड            |

## इंस्टॉलेशन

### स्टैंडअलोन

```bash
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step
pip install -e .

# या pip के माध्यम से (यदि उपलब्ध हो)
pip install ace-step
```

### ComfyUI इंटीग्रेशन

```bash
cd ComfyUI/custom_nodes
git clone https://github.com/ace-step/ComfyUI-ACE-Step
pip install -r ComfyUI-ACE-Step/requirements.txt
# ComfyUI पुनरारंभ करें — ACE-Step नोड दिखाई देंगे
```

## त्वरित प्रारम्भ

### इंस्टॉलेशन

ACE-Step एक Gradio वेब ऐप है — pip पैकेज नहीं। Git से इंस्टॉल करें:

```bash
# क्लोन और सेटअप
git clone https://github.com/ACE-Step/ACE-Step-1.5.git
cd ACE-Step-1.5

# विकल्प A: uv (अनुशंसित)
pip install uv
uv sync

# विकल्प B: pip
pip install -r requirements.txt
```

### वेब UI लॉन्च करें

```bash
# Gradio इंटरफ़ेस शुरू करें
python app.py --port 7860 --share

# कम VRAM (< 6GB) के लिए:
python app.py --port 7860 --half
```

खोलें `http://localhost:7860` अपने ब्राउज़र में। UI में है:

1. **प्रॉम्प्ट फ़ील्ड** — शैली वर्णन करें: "उत्साही इलेक्ट्रॉनिक पॉप, 120 BPM"
2. **लिरिक्स फ़ील्ड** — पद लिखें साथ में `[Verse]`, `[Chorus]` टैग
3. **अवधि स्लाइडर** — 15–120 सेकंड
4. **जनरेट बटन** — क्लिक करें और 2–8 सेकंड प्रतीक्षा करें

### लिरिक्स के साथ जनरेट करें (वेब UI)

लिरिक्स फ़ील्ड में दर्ज करें:

```
[Verse 1]
मैं देर रात GPU किराए पर लेता हूँ
सर्वर गुनगुनाते हैं, स्क्रीन इतनी चमकदार
मॉडल ट्रेन करना, सपनों का पीछा
कभी कुछ वैसा नहीं जैसा दिखता है

[Chorus]
हम आज कुछ नया बना रहे हैं
भविष्य सिर्फ एक प्रॉम्प्ट दूर है
हर टोकन, हर पंक्ति के साथ
कोड और संगीत आपस में इंटरट्वाइन होते हैं
```

प्रॉम्प्ट सेट करें: `इंडी रॉक बैलैड, अकॉस्टिक गिटार, भावनात्मक, पुरुष वोकल`

### CLI / पाइपलाइन उपयोग

```bash
# पाइपलाइन स्क्रिप्ट का सीधे कमांड लाइन से उपयोग करके जेनरेट करें
cd ACE-Step-1.5
python acestep/acestep_v15_pipeline.py \
  --prompt "लो-फाइ हिप हॉप, चिल, बरसात का दिन, पियानो, सॉफ्ट ड्रम्स" \
  --lyrics "" \
  --duration 30 \
  --output output.wav
```

### ComfyUI इंटीग्रेशन (बैच वर्कफ़्लो)

```bash
# बैच जनरेशन के लिए ComfyUI नोड इंस्टॉल करें
cd ComfyUI/custom_nodes
git clone https://github.com/ACE-Step/ComfyUI-ACE-Step
pip install -r ComfyUI-ACE-Step/requirements.txt
# ComfyUI पुनरारंभ करें — ACE-Step नोड नोड मेन्यू में दिखाई देंगे
```

ComfyUI नोड आपको विज़ुअल वर्कफ़्लो में विभिन्न प्रॉम्प्ट के साथ एकाधिक ट्रैक्स बैच-जनरेट करने देते हैं।

### स्टाइल टैग

स्टाइल टैग के साथ जनरेशन नियंत्रित करें:

```python
# शैली (Genre) टैग
"पॉप", "रॉक", "इलेक्ट्रॉनिक", "हिप-हॉप", "जाज़", "क्लासिकल", "मेटल",
"लो-फाइ", "सिन्थवेव", "एम्बियेंट", "फोक", "R&B", "कंट्री"

# मूड टैग
"खुश", "उदास", "ऊर्जावान", "चिल", "अंधेरा", "महाकाव्य", "रोमांटिक"

# इंस्ट्रुमेंट टैग
"पियानो", "गिटार", "ड्रम्स", "बेस", "सिन्थ", "स्ट्रिंग्स", "वायोलिन"

# वोकल टैग
"पुरुष वोकल", "महिला वोकल", "क्लासिक कोरस", "कोई वोकल नहीं", "हमिंग"

# तकनीकी टैग
"120 BPM", "माइनर की", "मेजर की", "4/4 टाइम"
```

## वेब UI

```bash
cd ACE-Step
python app.py --port 7860
# खोलें http://localhost:7860
```

वेब UI प्रदान करता है:

* स्टाइल प्रीसेट के साथ टेक्स्ट प्रॉम्प्ट इनपुट
* वर्स/कोरस फ़ॉर्मेटिंग के साथ लिरिक्स एडिटर
* अवधि और गुणवत्ता स्लाइडर
* रीयल-टाइम वेवफ़ॉर्म प्रीव्यू
* WAV या MP3 के रूप में डाउनलोड करें

## Clore.ai पर उपयोग के मामले

| उपयोग का मामला                   | सेटअप               | लागत        |
| -------------------------------- | ------------------- | ----------- |
| वीडियो के लिए बैकग्राउंड म्यूजिक | RTX 3060, बैच जनरेट | \~$0.15/दिन |
| गीत प्रोटोटाइपिंग / डेमो         | RTX 3080, रियल-टाइम | \~$0.3/दिन  |
| म्यूज़िक प्रोडक्शन पाइपलाइन      | RTX 4090 + ComfyUI  | \~$1/दिन    |
| पॉडकास्ट इंट्रो/आउट्रो           | कोई भी GPU, वन-शॉट  | \~$0.15/दिन |

## Clore.ai उपयोगकर्ताओं के लिए सुझाव

* **सबसे सस्ता AI वर्कलोड संभव**: RTX 3060 के लिए $0.15/दिन पर, सैंकड़ों ट्रैक्स पैसे के कुछ हिस्से में जेनरेट करें
* **रात भर बैच**: 8 घंटे के लिए GPU किराये पर लें ($0.05–0.1), 500+ ट्रैक्स जेनरेट करें
* **पाइपलाइनों के लिए ComfyUI**: एल्बम आर्ट वर्कफ़्लो के लिए इमेज जनरेशन के साथ चेन करें
* **एक्सपोर्ट गुणवत्ता**: उच्चतम गुणवत्ता पर जेनरेट करें, फिर आवश्यकता हो तो DAW में प्रोसेस करें
* **स्टाइल मिक्सिंग**: प्रॉम्प्ट में शैलियों को मिलाएं: "विनाइल क्रैकल के साथ लो-फाइ जैज़ हिप हॉप" आश्चर्यजनक रूप से अच्छा काम करता है

## समस्याओं का निवारण

| समस्या                        | समाधान                                                                                                                   |
| ----------------------------- | ------------------------------------------------------------------------------------------------------------------------ |
| CUDA नहीं मिला                | सुनिश्चित करें कि PyTorch CUDA के साथ इंस्टॉल है: `pip install torch --index-url https://download.pytorch.org/whl/cu121` |
| मॉडल डाउनलोड धीमा             | सेट करें `HF_HUB_ENABLE_HF_TRANSFER=1` तेज़ डाउनलोड के लिए                                                               |
| ऑडियो distorted सुनाई देता है | कम तापमान (0.7) या कम इन्फरेंस स्टेप्स आजमाएँ                                                                            |
| 4GB पर मेमोरी खत्म हो गई      | अवधि को 15 सेकंड तक कम करें; 6GB GPU में अपग्रेड करें                                                                    |
| ComfyUI नोड्स गायब हैं        | कस्टम नोड्स इंस्टॉल करने के बाद ComfyUI पुनरारंभ करें                                                                    |

## ACE-Step बनाम Suno बनाम AudioCraft

| फ़ीचर              | ACE-Step 1.5  | Suno v4         | AudioCraft     |
| ------------------ | ------------- | --------------- | -------------- |
| पूर्ण गीत          | ✅             | ✅               | ❌ (केवल संगीत) |
| वोकल               | ✅             | ✅               | ❌              |
| लोकल/स्वयं-होस्टेड | ✅             | ❌ (क्लाउड)      | ✅              |
| लाइसेंस            | MIT           | प्रोप्रायटरी    | MIT            |
| न्यूनतम VRAM       | 4GB           | लागू नहीं       | 16GB           |
| गति (30s)          | 2–8 सेकंड     | \~30 सेकंड      | \~60 सेकंड     |
| लागत               | $0.15/दिन GPU | $10/माह सदस्यता | $0.3/दिन GPU   |

## अधिक पढ़ने के लिए

* [GitHub रिपॉजिटरी](https://github.com/ace-step/ACE-Step)
* [ComfyUI नोड्स](https://github.com/ace-step/ComfyUI-ACE-Step)
* [AudioCraft गाइड](/guides/guides_v2-hi/audio-and-voice/audiocraft-music.md) — केवल इंस्ट्रुमेंटल संगीत के लिए


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-hi/music-generation/ace-step.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
