ACE-Step — генерация музыки

Генерируйте полноформатные песни с вокалом с помощью ACE-Step — опенсорсной альтернативы Suno, работающей на <4GB VRAM

ACE-Step 1.5 — это прорыв в генерации музыки с открытым исходным кодом, которого все ждали. Он генерирует полные песни с вокалом и инструментами по текстовым подсказкам, соперничая с коммерческими сервисами, такими как Suno — но работает локально на вашей GPU с Лицензия MIT. Главная особенность? Ему требуется менее 4 ГБ видеопамяти (VRAM), что делает его самым доступным инструментом ИИ для музыки. Сгенерируйте полный трек за 2–8 секунд на RTX 4090.

Ключевые особенности

  • Генерация полной песни: Вокал + инструменты + эффекты за один проход

  • < 4 ГБ VRAM: Работает даже на самых дешёвых GPU (RTX 3060, даже GTX 1060!)

  • 2–8 секунд на трек: Почти мгновенная генерация на современных GPU

  • Лицензия MIT: Полное коммерческое использование, без ограничений

  • Поддержка текста песен: Пишите собственные тексты со структурой куплет/припев

  • Контроль стиля: Теги жанра, настроение, темп, инструментация

  • Интеграция с ComfyUI: Узловой рабочий процесс для сложных музыкальных конвейеров

Требования

Компонент
Минимум
Рекомендуется

GPU

Любой с 4 ГБ VRAM

RTX 3060 или лучше

VRAM

4 ГБ

6 ГБ+

ОЗУ

8GB

16GB

Диск

10GB

15GB

Python

3.10+

3.11

Рекомендуемый GPU на Clore.ai: RTX 3060 6 ГБ (~$0.15–0.3/день) — да, самый дешёвый GPU подходит!

Справка по скорости

GPU
Время генерации (30 с трек)

GTX 1060 6GB

~15–20 сек

RTX 3060 12GB

~6–10 сек

RTX 3080 10GB

~4–6 сек

RTX 4090 24GB

~2–3 сек

Установка

Автономный

Интеграция с ComfyUI

Быстрый старт

Установка

ACE-Step — это веб-приложение на Gradio, а не пакет pip. Установите из Git:

Запуск веб-интерфейса

Откройте http://localhost:7860 в вашем браузере. Интерфейс включает:

  1. Поле подсказки — опишите стиль: "жизнерадостный электронный поп, 120 BPM"

  2. Поле для текста песни — пишите куплеты с помощью [Куплет], [Припев] тегов

  3. Ползунок длительности — 15–120 секунд

  4. Кнопка генерации — нажмите и подождите 2–8 секунд

Генерация с текстом (веб-интерфейс)

Введите в поле для текста песни:

Установите подсказку на: инди-рок баллада, акустическая гитара, эмоционально, мужской вокал

Использование через CLI / конвейер

Интеграция ComfyUI (пакетная обработка)

Узлы ComfyUI позволяют пакетно генерировать несколько треков с разными подсказками в визуальном рабочем процессе.

Теги стиля

Контролируйте генерацию с помощью тегов стиля:

Веб-интерфейс

Веб-интерфейс предоставляет:

  • Ввод текстовой подсказки с предустановками стиля

  • Редактор текста песен с форматированием куплет/припев

  • Ползунки длительности и качества

  • Просмотр формы волны в реальном времени

  • Скачивание в формате WAV или MP3

Сценарии использования на Clore.ai

Случай использования
Настройка
Стоимость

Фоновая музыка для видео

RTX 3060, пакетная генерация

~$0.15/день

Прототипирование песен / демо

RTX 3080, в реальном времени

~$0.3/день

Конвейер музыкального производства

RTX 4090 + ComfyUI

~$1/день

Интро/аутро для подкастов

Любая GPU, одиночный прогон

~$0.15/день

Советы для пользователей Clore.ai

  • Самая дешевая задача ИИ, какая только возможна: По цене $0.15/день за RTX 3060 генерируйте сотни треков за копейки

  • Пакетная генерация ночью: Арендуйте GPU на 8 часов ($0.05–0.1), сгенерируйте 500+ треков

  • ComfyUI для конвейеров: Сочетайте с генерацией изображений для рабочих процессов по созданию обложек альбомов

  • Качество экспорта: Генерируйте в максимальном качестве, затем при необходимости обрабатывайте в DAW

  • Смешение стилей: Комбинируйте жанры в подсказках: "lo-fi jazz hip hop с потрескиванием винила" работает удивительно хорошо

Устранение неполадок

Проблема
Решение

CUDA не найдена

Убедитесь, что PyTorch установлен с поддержкой CUDA: pip install torch --index-url https://download.pytorch.org/whl/cu121

Загрузка модели медленная

Установите HF_HUB_ENABLE_HF_TRANSFER=1 для более быстрой загрузки

Аудио искажено

Попробуйте понизить температуру (0.7) или уменьшить количество шагов инференса

Недостаточно памяти на 4 ГБ

Уменьшите длительность до 15 секунд; обновитесь до GPU с 6 ГБ

Узлы ComfyUI отсутствуют

Перезапустите ComfyUI после установки пользовательских узлов

ACE-Step против Suno и AudioCraft

Функция
ACE-Step 1.5
Suno v4
AudioCraft

Полные песни

❌ (только музыка)

Вокал

Локальный/самохостинг

❌ (облако)

Лицензия

MIT

Проприетарный

MIT

Мин. VRAM

4 ГБ

N/A

16GB

Скорость (30 с)

2–8 сек

~30 сек

~60 сек

Стоимость

$0.15/день за GPU

$10/месяц подписка

$0.3/день за GPU

Дополнительное чтение

Последнее обновление

Это было полезно?