# ACE-Step Musikgenerierung

ACE-Step 1.5 ist der Open-Source-Durchbruch zur Musikgenerierung, auf den alle gewartet haben. Es erzeugt **vollständige Lieder mit Gesang und Instrumenten** aus Text-Prompts, vergleichbar mit kommerziellen Diensten wie Suno – läuft aber lokal auf deiner GPU mit einem **MIT-Lizenz**. Das Killer-Feature? Es benötigt **weniger als 4 GB VRAM**, wodurch es das zugänglichste KI-Musiktool aller Zeiten ist. Erzeuge einen vollständigen Track in 2–8 Sekunden auf einer RTX 4090.

## Hauptmerkmale

* **Vollständige Song-Generierung**: Gesang + Instrumente + Effekte in einem Durchlauf
* **< 4GB VRAM**: Läuft sogar auf den günstigsten GPUs (RTX 3060, sogar GTX 1060!)
* **2–8 Sekunden pro Track**: Nahezu sofortige Generierung auf modernen GPUs
* **MIT-Lizenz**: Vollständige kommerzielle Nutzung, keine Einschränkungen
* **Lyrics-Unterstützung**: Schreibe eigene Texte mit Vers/Refrain-Struktur
* **Stilsteuerung**: Genre-Tags, Stimmung, Tempo, Instrumentierung
* **ComfyUI-Integration**: Knotenbasierter Workflow für komplexe Musik-Pipelines

## Anforderungen

| Komponente | Minimum           | Empfohlen            |
| ---------- | ----------------- | -------------------- |
| GPU        | Jede mit 4GB VRAM | RTX 3060 oder besser |
| VRAM       | 4GB               | 6GB+                 |
| RAM        | 8GB               | 16GB                 |
| Festplatte | 10GB              | 15GB                 |
| Python     | 3.10+             | 3.11                 |

**Empfohlene Clore.ai-GPU**: RTX 3060 6GB (\~0,15–0,3 $/Tag) — ja, die günstigste GPU funktioniert!

### Geschwindigkeitsreferenz

| GPU           | Generierungszeit (30s Track) |
| ------------- | ---------------------------- |
| GTX 1060 6GB  | \~15–20 Sek                  |
| RTX 3060 12GB | \~6–10 Sek                   |
| RTX 3080 10GB | \~4–6 Sek                    |
| RTX 4090 24GB | \~2–3 Sek                    |

## Installation

### Standalone

```bash
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step
pip install -e .

# Oder via pip (falls verfügbar)
pip install ace-step
```

### ComfyUI-Integration

```bash
cd ComfyUI/custom_nodes
git clone https://github.com/ace-step/ComfyUI-ACE-Step
pip install -r ComfyUI-ACE-Step/requirements.txt
# ComfyUI neu starten — ACE-Step-Knoten werden erscheinen
```

## Schnellstart

### Installation

ACE-Step ist eine Gradio-Web-App — kein pip-Paket. Installiere aus dem Git:

```bash
# Klonen und einrichten
git clone https://github.com/ACE-Step/ACE-Step-1.5.git
cd ACE-Step-1.5

# Option A: uv (empfohlen)
pip install uv
uv sync

# Option B: pip
pip install -r requirements.txt
```

### Web UI starten

```bash
# Starte die Gradio-Oberfläche
python app.py --port 7860 --share

# Für niedrigen VRAM (< 6GB):
python app.py --port 7860 --half
```

Öffnen `http://localhost:7860` in deinem Browser. Die UI hat:

1. **Prompt-Feld** — beschreibe den Stil: "fröhlicher elektronischer Pop, 120 BPM"
2. **Lyrics-Feld** — schreibe Verse mit `[Verse]`, `[Chorus]` Tags
3. **Dauer-Slider** — 15–120 Sekunden
4. **Generieren-Button** — klicken und 2–8 Sekunden warten

### Mit Lyrics generieren (Web UI)

Gib im Lyrics-Feld ein:

```
[Verse 1]
Ich miete die GPUs spät in der Nacht
Die Server summen, Bildschirme so hell
Modelle trainierend, Träume jagend
Nichts ist jemals so, wie es scheint

[Chorus]
Wir bauen heute etwas Neues
Die Zukunft ist nur ein Prompt entfernt
Mit jedem Token, jeder Zeile
Verschlingen sich Code und Musik
```

Setze den Prompt auf: `indie Rockballade, akustische Gitarre, emotional, männlicher Gesang`

### CLI / Pipeline-Nutzung

```bash
# Generiere über die Kommandozeile direkt mit dem Pipeline-Skript
cd ACE-Step-1.5
python acestep/acestep_v15_pipeline.py \
  --prompt "lo-fi hip hop, chill, rainy day, piano, soft drums" \
  --lyrics "" \
  --duration 30 \
  --output output.wav
```

### ComfyUI-Integration (Batch-Workflow)

```bash
# Installiere ComfyUI-Knoten für Batch-Generierung
cd ComfyUI/custom_nodes
git clone https://github.com/ACE-Step/ComfyUI-ACE-Step
pip install -r ComfyUI-ACE-Step/requirements.txt
# ComfyUI neu starten — ACE-Step-Knoten erscheinen im Knotenmenü
```

ComfyUI-Knoten ermöglichen das Batch-Generieren mehrerer Tracks mit unterschiedlichen Prompts in einem visuellen Workflow.

### Stil-Tags

Steuere die Generierung mit Stil-Tags:

```python
# Genre-Tags
"pop", "rock", "electronic", "hip-hop", "jazz", "classical", "metal",
"lo-fi", "synthwave", "ambient", "folk", "R&B", "country"

# Stimmungs-Tags
"happy", "sad", "energetic", "chill", "dark", "epic", "romantic"

# Instrumenten-Tags
"piano", "guitar", "drums", "bass", "synth", "strings", "violin"

# Vocal-Tags
"male vocal", "female vocal", "choir", "no vocals", "humming"

# Technische Tags
"120 BPM", "minor key", "major key", "4/4 time"
```

## Web UI

```bash
cd ACE-Step
python app.py --port 7860
# Öffne http://localhost:7860
```

Die Web-Oberfläche bietet:

* Texteingabe für Prompts mit Stil-Voreinstellungen
* Lyrics-Editor mit Vers-/Refrain-Formatierung
* Dauer- und Qualitäts-Slider
* Echtzeit-Wellenform-Vorschau
* Herunterladen als WAV oder MP3

## Anwendungsfälle auf Clore.ai

| Einsatzgebiet               | Einrichtung                 | Kosten       |
| --------------------------- | --------------------------- | ------------ |
| Hintergrundmusik für Videos | RTX 3060, Batch-Generierung | \~0,15 $/Tag |
| Song-Prototyping / Demos    | RTX 3080, Echtzeit          | \~0,3 $/Tag  |
| Musikproduktions-Pipeline   | RTX 4090 + ComfyUI          | \~1 $/Tag    |
| Podcast-Intros/Outros       | Jede GPU, einmalig          | \~0,15 $/Tag |

## Tipps für Clore.ai-Nutzer

* **Möglichst günstigste KI-Arbeitslast**: Bei 0,15 $/Tag für RTX 3060 Hunderte von Tracks für ein paar Cent erzeugen
* **Batch über Nacht**: Miete eine GPU für 8 Stunden (0,05–0,1 $), generiere 500+ Tracks
* **ComfyUI für Pipelines**: Kette mit Bilderzeugung für Workflows zur Albumgestaltung
* **Exportqualität**: Erzeuge in höchster Qualität und bearbeite bei Bedarf in einer DAW
* **Stilmischung**: Kombiniere Genres in Prompts: "lo-fi jazz hip hop mit Vinyl-Knistern" funktioniert überraschend gut

## Fehlerbehebung

| Problem                         | Lösung                                                                                                                       |
| ------------------------------- | ---------------------------------------------------------------------------------------------------------------------------- |
| CUDA nicht gefunden             | Stelle sicher, dass PyTorch mit CUDA installiert ist: `pip install torch --index-url https://download.pytorch.org/whl/cu121` |
| Modell-Download langsam         | Setze `HF_HUB_ENABLE_HF_TRANSFER=1` für schnellere Downloads                                                                 |
| Audio klingt verzerrt           | Versuche eine niedrigere Temperatur (0,7) oder weniger Inferenz-Schritte                                                     |
| Nicht genügend Speicher bei 4GB | Reduziere die Dauer auf 15 Sekunden; upgrade auf eine 6GB-GPU                                                                |
| ComfyUI-Knoten fehlen           | Starte ComfyUI nach der Installation der benutzerdefinierten Knoten neu                                                      |

## ACE-Step vs Suno vs AudioCraft

| Funktion                | ACE-Step 1.5   | Suno v4        | AudioCraft    |
| ----------------------- | -------------- | -------------- | ------------- |
| Vollständige Songs      | ✅              | ✅              | ❌ (nur Musik) |
| Gesang                  | ✅              | ✅              | ❌             |
| Lokal / selbst gehostet | ✅              | ❌ (Cloud)      | ✅             |
| Lizenz                  | MIT            | Proprietär     | MIT           |
| Min. VRAM               | 4GB            | N/A            | 16GB          |
| Geschwindigkeit (30s)   | 2–8 Sek        | \~30 Sek.      | \~60 Sek      |
| Kosten                  | 0,15 $/Tag GPU | 10 $/Monat Abo | 0,3 $/Tag GPU |

## Weiterführende Lektüre

* [GitHub-Repository](https://github.com/ace-step/ACE-Step)
* [ComfyUI-Knoten](https://github.com/ace-step/ComfyUI-ACE-Step)
* [AudioCraft-Anleitung](https://docs.clore.ai/guides/guides_v2-de/audio-and-stimme/audiocraft-music) — für nur instrumentale Musik
