# Génération musicale ACE-Step

ACE-Step 1.5 est la percée open-source de génération musicale que tout le monde attendait. Il génère **chansons complètes avec voix et instruments** à partir d'instructions textuelles, rivalisant avec des services commerciaux comme Suno — mais fonctionne localement sur votre GPU avec un **Licence MIT**. La fonctionnalité clé ? Il nécessite **moins de 4 Go de VRAM**, ce qui en fait l'outil d'IA musicale le plus accessible jamais créé. Générez une piste complète en 2–8 secondes sur une RTX 4090.

## Principales caractéristiques

* **Génération de chanson complète**: Voix + instruments + effets en un seul passage
* **< 4GB VRAM**: Fonctionne même sur les GPU les moins chers (RTX 3060, voire GTX 1060 !)
* **2–8 secondes par piste**: Génération quasi instantanée sur les GPU modernes
* **Licence MIT**: Utilisation commerciale totale, sans restrictions
* **Support des paroles**: Écrivez vos propres paroles avec structure couplet/refrain
* **Contrôle du style**: Étiquettes de genre, ambiance, tempo, instrumentation
* **Intégration ComfyUI**: Flux de travail basé sur des nœuds pour des pipelines musicaux complexes

## Exigences

| Composant | Minimum                            | Recommandé        |
| --------- | ---------------------------------- | ----------------- |
| GPU       | N'importe lequel avec 4 Go de VRAM | RTX 3060 ou mieux |
| VRAM      | 4 Go                               | 6GB+              |
| RAM       | 8 Go                               | 16Go              |
| Disque    | 10Go                               | 15 Go             |
| Python    | 3.10+                              | 3.11              |

**GPU recommandé par Clore.ai**: RTX 3060 6GB (\~0,15–0,3 $/jour) — oui, le GPU le moins cher fonctionne !

### Référence de vitesse

| GPU           | Temps de génération (piste de 30s) |
| ------------- | ---------------------------------- |
| GTX 1060 6 Go | \~15–20 s                          |
| RTX 3060 12GB | \~6–10 s                           |
| RTX 3080 10Go | \~4–6 s                            |
| RTX 4090 24GB | \~2–3 s                            |

## Installation

### Autonome

```bash
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step
pip install -e .

# Ou via pip (si disponible)
pip install ace-step
```

### Intégration ComfyUI

```bash
cd ComfyUI/custom_nodes
git clone https://github.com/ace-step/ComfyUI-ACE-Step
pip install -r ComfyUI-ACE-Step/requirements.txt
# Redémarrez ComfyUI — les nœuds ACE-Step apparaîtront
```

## Démarrage rapide

### Installation

ACE-Step est une application web Gradio — pas un paquet pip. Installez depuis Git :

```bash
# Clonez et configurez
git clone https://github.com/ACE-Step/ACE-Step-1.5.git
cd ACE-Step-1.5

# Option A : uv (recommandé)
pip install uv
uv sync

# Option B : pip
pip install -r requirements.txt
```

### Lancer l'interface Web

```bash
# Démarrer l'interface Gradio
python app.py --port 7860 --share

# Pour faible VRAM (< 6GB) :
python app.py --port 7860 --half
```

Ouvrir `http://localhost:7860` dans votre navigateur. L'interface comprend :

1. **Champ de prompt** — décrivez le style : "pop électronique entraînante, 120 BPM"
2. **Champ de paroles** — écrivez des couplets avec `[Verse]`, `[Chorus]` étiquettes
3. **Curseur de durée** — 15–120 secondes
4. **Bouton Générer** — cliquez et attendez 2–8 secondes

### Générer avec paroles (interface Web)

Entrez dans le champ de paroles :

```
[Verse 1]
Je loue les GPU tard dans la nuit
Les serveurs bourdonnent, écrans si brillants
Entraînant des modèles, poursuivant des rêves
Rien n'est jamais ce qu'il semble

[Chorus]
Nous construisons quelque chose de nouveau aujourd'hui
Le futur n'est qu'à un prompt
À chaque token, chaque ligne
Le code et la musique s'entrelacent
```

Réglez le prompt sur : `ballade rock indie, guitare acoustique, émotionnel, voix masculine`

### Utilisation CLI / Pipeline

```bash
# Générez depuis la ligne de commande en utilisant directement le script pipeline
cd ACE-Step-1.5
python acestep/acestep_v15_pipeline.py \
  --prompt "lo-fi hip hop, chill, rainy day, piano, soft drums" \
  --lyrics "" \
  --duration 30 \
  --output output.wav
```

### Intégration ComfyUI (flux de travail par lot)

```bash
# Installez les nœuds ComfyUI pour la génération par lot
cd ComfyUI/custom_nodes
git clone https://github.com/ACE-Step/ComfyUI-ACE-Step
pip install -r ComfyUI-ACE-Step/requirements.txt
# Redémarrez ComfyUI — les nœuds ACE-Step apparaissent dans le menu des nœuds
```

Les nœuds ComfyUI vous permettent de générer par lot plusieurs pistes avec différents prompts dans un flux de travail visuel.

### Étiquettes de style

Contrôlez la génération avec des étiquettes de style :

```python
# Étiquettes de genre
"pop", "rock", "électronique", "hip-hop", "jazz", "classique", "metal",
"lo-fi", "synthwave", "ambient", "folk", "R&B", "country"

# Étiquettes d'ambiance
"joyeux", "triste", "énergique", "détendu", "sombre", "épique", "romantique"

# Étiquettes d'instruments
"piano", "guitare", "batterie", "basse", "synthé", "cordes", "violon"

# Étiquettes vocales
"voix masculine", "voix féminine", "chœur", "sans voix", "bourdonnement"

# Étiquettes techniques
"120 BPM", "ton mineur", "ton majeur", "mesure 4/4"
```

## Interface Web

```bash
cd ACE-Step
python app.py --port 7860
# Ouvrez http://localhost:7860
```

L'interface web fournit :

* Saisie de prompt texte avec préréglages de style
* Éditeur de paroles avec formatage couplet/refrain
* Curseurs de durée et de qualité
* Aperçu d'onde en temps réel
* Télécharger en WAV ou MP3

## Cas d'utilisation sur Clore.ai

| Cas d'utilisation               | Configuration                         | Coût          |
| ------------------------------- | ------------------------------------- | ------------- |
| Musique de fond pour vidéos     | RTX 3060, génération par lots         | \~0,15 $/jour |
| Prototypage de chansons / démos | RTX 3080, en temps réel               | \~0,3 $/jour  |
| Pipeline de production musicale | RTX 4090 + ComfyUI                    | \~1 $/jour    |
| Intros/outros de podcast        | N'importe quel GPU, en une seule fois | \~0,15 $/jour |

## Conseils pour les utilisateurs de Clore.ai

* **La charge de travail IA la moins chère possible**: À 0,15 $/jour pour une RTX 3060, générez des centaines de pistes pour des centimes
* **Traitement par lot pendant la nuit**: Louez un GPU pendant 8 heures (0,05–0,1 $), générez 500+ pistes
* **ComfyUI pour les pipelines**: Chaînez avec la génération d'images pour des workflows de pochette d'album
* **Qualité d'exportation**: Générez à la plus haute qualité, puis traitez dans un DAW si nécessaire
* **Mélange de styles**: Combinez des genres dans les prompts : "lo-fi jazz hip hop avec crépitement de vinyle" fonctionne étonnamment bien

## Dépannage

| Problème                      | Solution                                                                                                                 |
| ----------------------------- | ------------------------------------------------------------------------------------------------------------------------ |
| CUDA introuvable              | Assurez-vous que PyTorch est installé avec CUDA : `pip install torch --index-url https://download.pytorch.org/whl/cu121` |
| Téléchargement du modèle lent | Définir `HF_HUB_ENABLE_HF_TRANSFER=1` pour des téléchargements plus rapides                                              |
| L'audio semble déformé        | Essayez une température plus basse (0,7) ou moins d'étapes d'inférence                                                   |
| Manque de mémoire sur 4GB     | Réduisez la durée à 15 secondes ; passez à un GPU de 6GB                                                                 |
| Nœuds ComfyUI manquants       | Redémarrez ComfyUI après l'installation des nœuds personnalisés                                                          |

## ACE-Step vs Suno vs AudioCraft

| Fonction           | ACE-Step 1.5    | Suno v4              | AudioCraft             |
| ------------------ | --------------- | -------------------- | ---------------------- |
| Chansons complètes | ✅               | ✅                    | ❌ (musique uniquement) |
| Voix               | ✅               | ✅                    | ❌                      |
| Local/autohébergé  | ✅               | ❌ (cloud)            | ✅                      |
| Licence            | MIT             | Propriétaire         | MIT                    |
| VRAM min           | 4 Go            | N/A                  | 16Go                   |
| Vitesse (30s)      | 2–8 s           | \~30 s               | \~60 s                 |
| Coût               | 0,15 $/jour GPU | 10 $/mois abonnement | 0,3 $/jour GPU         |

## Lectures complémentaires

* [Dépôt GitHub](https://github.com/ace-step/ACE-Step)
* [Nœuds ComfyUI](https://github.com/ace-step/ComfyUI-ACE-Step)
* [Guide AudioCraft](/guides/guides_v2-fr/audio-et-voix/audiocraft-music.md) — pour musique instrumentale uniquement


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-fr/generation-musicale/ace-step.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
