# ACE-Step Musikgenerierung

ACE-Step 1.5 ist der Open-Source-Durchbruch zur Musikgenerierung, auf den alle gewartet haben. Es erzeugt **vollständige Lieder mit Gesang und Instrumenten** aus Text-Prompts, vergleichbar mit kommerziellen Diensten wie Suno – läuft aber lokal auf deiner GPU mit einem **MIT-Lizenz**. Das Killer-Feature? Es benötigt **weniger als 4 GB VRAM**, wodurch es das zugänglichste KI-Musiktool aller Zeiten ist. Erzeuge einen vollständigen Track in 2–8 Sekunden auf einer RTX 4090.

## Hauptmerkmale

* **Vollständige Song-Generierung**: Gesang + Instrumente + Effekte in einem Durchlauf
* **< 4GB VRAM**: Läuft sogar auf den günstigsten GPUs (RTX 3060, sogar GTX 1060!)
* **2–8 Sekunden pro Track**: Nahezu sofortige Generierung auf modernen GPUs
* **MIT-Lizenz**: Vollständige kommerzielle Nutzung, keine Einschränkungen
* **Lyrics-Unterstützung**: Schreibe eigene Texte mit Vers/Refrain-Struktur
* **Stilsteuerung**: Genre-Tags, Stimmung, Tempo, Instrumentierung
* **ComfyUI-Integration**: Knotenbasierter Workflow für komplexe Musik-Pipelines

## Anforderungen

| Komponente | Minimum           | Empfohlen            |
| ---------- | ----------------- | -------------------- |
| GPU        | Jede mit 4GB VRAM | RTX 3060 oder besser |
| VRAM       | 4GB               | 6GB+                 |
| RAM        | 8GB               | 16GB                 |
| Festplatte | 10GB              | 15GB                 |
| Python     | 3.10+             | 3.11                 |

**Empfohlene Clore.ai-GPU**: RTX 3060 6GB (\~0,15–0,3 $/Tag) — ja, die günstigste GPU funktioniert!

### Geschwindigkeitsreferenz

| GPU           | Generierungszeit (30s Track) |
| ------------- | ---------------------------- |
| GTX 1060 6GB  | \~15–20 Sek                  |
| RTX 3060 12GB | \~6–10 Sek                   |
| RTX 3080 10GB | \~4–6 Sek                    |
| RTX 4090 24GB | \~2–3 Sek                    |

## Installation

### Standalone

```bash
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step
pip install -e .

# Oder via pip (falls verfügbar)
pip install ace-step
```

### ComfyUI-Integration

```bash
cd ComfyUI/custom_nodes
git clone https://github.com/ace-step/ComfyUI-ACE-Step
pip install -r ComfyUI-ACE-Step/requirements.txt
# ComfyUI neu starten — ACE-Step-Knoten werden erscheinen
```

## Schnellstart

### Installation

ACE-Step ist eine Gradio-Web-App — kein pip-Paket. Installiere aus dem Git:

```bash
# Klonen und einrichten
git clone https://github.com/ACE-Step/ACE-Step-1.5.git
cd ACE-Step-1.5

# Option A: uv (empfohlen)
pip install uv
uv sync

# Option B: pip
pip install -r requirements.txt
```

### Web UI starten

```bash
# Starte die Gradio-Oberfläche
python app.py --port 7860 --share

# Für niedrigen VRAM (< 6GB):
python app.py --port 7860 --half
```

Öffnen `http://localhost:7860` in deinem Browser. Die UI hat:

1. **Prompt-Feld** — beschreibe den Stil: "fröhlicher elektronischer Pop, 120 BPM"
2. **Lyrics-Feld** — schreibe Verse mit `[Verse]`, `[Chorus]` Tags
3. **Dauer-Slider** — 15–120 Sekunden
4. **Generieren-Button** — klicken und 2–8 Sekunden warten

### Mit Lyrics generieren (Web UI)

Gib im Lyrics-Feld ein:

```
[Verse 1]
Ich miete die GPUs spät in der Nacht
Die Server summen, Bildschirme so hell
Modelle trainierend, Träume jagend
Nichts ist jemals so, wie es scheint

[Chorus]
Wir bauen heute etwas Neues
Die Zukunft ist nur ein Prompt entfernt
Mit jedem Token, jeder Zeile
Verschlingen sich Code und Musik
```

Setze den Prompt auf: `indie Rockballade, akustische Gitarre, emotional, männlicher Gesang`

### CLI / Pipeline-Nutzung

```bash
# Generiere über die Kommandozeile direkt mit dem Pipeline-Skript
cd ACE-Step-1.5
python acestep/acestep_v15_pipeline.py \
  --prompt "lo-fi hip hop, chill, rainy day, piano, soft drums" \
  --lyrics "" \
  --duration 30 \
  --output output.wav
```

### ComfyUI-Integration (Batch-Workflow)

```bash
# Installiere ComfyUI-Knoten für Batch-Generierung
cd ComfyUI/custom_nodes
git clone https://github.com/ACE-Step/ComfyUI-ACE-Step
pip install -r ComfyUI-ACE-Step/requirements.txt
# ComfyUI neu starten — ACE-Step-Knoten erscheinen im Knotenmenü
```

ComfyUI-Knoten ermöglichen das Batch-Generieren mehrerer Tracks mit unterschiedlichen Prompts in einem visuellen Workflow.

### Stil-Tags

Steuere die Generierung mit Stil-Tags:

```python
# Genre-Tags
"pop", "rock", "electronic", "hip-hop", "jazz", "classical", "metal",
"lo-fi", "synthwave", "ambient", "folk", "R&B", "country"

# Stimmungs-Tags
"happy", "sad", "energetic", "chill", "dark", "epic", "romantic"

# Instrumenten-Tags
"piano", "guitar", "drums", "bass", "synth", "strings", "violin"

# Vocal-Tags
"male vocal", "female vocal", "choir", "no vocals", "humming"

# Technische Tags
"120 BPM", "minor key", "major key", "4/4 time"
```

## Web UI

```bash
cd ACE-Step
python app.py --port 7860
# Öffne http://localhost:7860
```

Die Web-Oberfläche bietet:

* Texteingabe für Prompts mit Stil-Voreinstellungen
* Lyrics-Editor mit Vers-/Refrain-Formatierung
* Dauer- und Qualitäts-Slider
* Echtzeit-Wellenform-Vorschau
* Herunterladen als WAV oder MP3

## Anwendungsfälle auf Clore.ai

| Einsatzgebiet               | Einrichtung                 | Kosten       |
| --------------------------- | --------------------------- | ------------ |
| Hintergrundmusik für Videos | RTX 3060, Batch-Generierung | \~0,15 $/Tag |
| Song-Prototyping / Demos    | RTX 3080, Echtzeit          | \~0,3 $/Tag  |
| Musikproduktions-Pipeline   | RTX 4090 + ComfyUI          | \~1 $/Tag    |
| Podcast-Intros/Outros       | Jede GPU, einmalig          | \~0,15 $/Tag |

## Tipps für Clore.ai-Nutzer

* **Möglichst günstigste KI-Arbeitslast**: Bei 0,15 $/Tag für RTX 3060 Hunderte von Tracks für ein paar Cent erzeugen
* **Batch über Nacht**: Miete eine GPU für 8 Stunden (0,05–0,1 $), generiere 500+ Tracks
* **ComfyUI für Pipelines**: Kette mit Bilderzeugung für Workflows zur Albumgestaltung
* **Exportqualität**: Erzeuge in höchster Qualität und bearbeite bei Bedarf in einer DAW
* **Stilmischung**: Kombiniere Genres in Prompts: "lo-fi jazz hip hop mit Vinyl-Knistern" funktioniert überraschend gut

## Fehlerbehebung

| Problem                         | Lösung                                                                                                                       |
| ------------------------------- | ---------------------------------------------------------------------------------------------------------------------------- |
| CUDA nicht gefunden             | Stelle sicher, dass PyTorch mit CUDA installiert ist: `pip install torch --index-url https://download.pytorch.org/whl/cu121` |
| Modell-Download langsam         | Setze `HF_HUB_ENABLE_HF_TRANSFER=1` für schnellere Downloads                                                                 |
| Audio klingt verzerrt           | Versuche eine niedrigere Temperatur (0,7) oder weniger Inferenz-Schritte                                                     |
| Nicht genügend Speicher bei 4GB | Reduziere die Dauer auf 15 Sekunden; upgrade auf eine 6GB-GPU                                                                |
| ComfyUI-Knoten fehlen           | Starte ComfyUI nach der Installation der benutzerdefinierten Knoten neu                                                      |

## ACE-Step vs Suno vs AudioCraft

| Funktion                | ACE-Step 1.5   | Suno v4        | AudioCraft    |
| ----------------------- | -------------- | -------------- | ------------- |
| Vollständige Songs      | ✅              | ✅              | ❌ (nur Musik) |
| Gesang                  | ✅              | ✅              | ❌             |
| Lokal / selbst gehostet | ✅              | ❌ (Cloud)      | ✅             |
| Lizenz                  | MIT            | Proprietär     | MIT           |
| Min. VRAM               | 4GB            | N/A            | 16GB          |
| Geschwindigkeit (30s)   | 2–8 Sek        | \~30 Sek.      | \~60 Sek      |
| Kosten                  | 0,15 $/Tag GPU | 10 $/Monat Abo | 0,3 $/Tag GPU |

## Weiterführende Lektüre

* [GitHub-Repository](https://github.com/ace-step/ACE-Step)
* [ComfyUI-Knoten](https://github.com/ace-step/ComfyUI-ACE-Step)
* [AudioCraft-Anleitung](/guides/guides_v2-de/audio-and-sprache/audiocraft-music.md) — für nur instrumentale Musik


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-de/musikgenerierung/ace-step.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
