Stable Audio

Генерируйте музыку и звуковые эффекты со Stable Audio на Clore.ai

Генерируйте музыку и звуковые эффекты с помощью Stable Audio от Stability AI на GPU CLORE.AI.

circle-check

Почему Stable Audio?

  • Высокое качество - Генерация стереозвука 44,1 кГц

  • Переменная длина - Генерация до 95 секунд

  • Универсальный - Музыка, звуковые эффекты, атмосферные звуки

  • Текст в аудио - Опишите, что хотите услышать

  • Открытые веса - Доступен Stable Audio Open

Варианты моделей

Модель
Длительность
Качество
VRAM
Лицензия

Stable Audio Open

47 сек

Хорошо

8GB

Откройте

Stable Audio 2.0

3 мин

Отлично

12GB

Коммерческое

Быстрое развертывание на CLORE.AI

Docker-образ:

pytorch/pytorch:2.5.1-cuda12.4-cudnn9-devel

Порты:

Команда:

Доступ к вашему сервису

После развертывания найдите ваш http_pub URL в Моих заказах:

  1. Перейдите на Моих заказах страницу

  2. Нажмите на ваш заказ

  3. Найдите http_pub URL (например, abc123.clorecloud.net)

Используйте https://YOUR_HTTP_PUB_URL вместо localhost в примерах ниже.

Требования к оборудованию

Модель
Минимальная GPU
Рекомендуется

Stable Audio Open

RTX 3070 8GB

RTX 3090 24GB

Stable Audio 2.0

RTX 3090 12 ГБ

RTX 4090 24GB

Установка

Базовое использование

Текст в музыку

Звуковые эффекты

Атмосферные звуки

Примеры подсказок

Жанры музыки

Звуковые эффекты

Атмосфера/Фон

Дополнительные параметры

Управление генерацией

Переменная длина

Пакетная генерация

Веб-интерфейс Gradio

Производительность

Длительность
Шаги
GPU
Время

10 сек

100

RTX 3090

~15с

10 сек

100

RTX 4090

~10с

30 сек

100

RTX 3090

~40с

30 сек

100

RTX 4090

~25с

47 сек

100

RTX 4090

~40с

Советы по качеству

Лучше для музыки

Лучше для звуковых эффектов

Оценка стоимости

Типичные расценки на маркетплейсе CLORE.AI:

GPU
Почасовая ставка
~30-сек фрагментов/час

RTX 3060 12GB

~$0.03

~50

RTX 3090 24GB

~$0.06

~90

RTX 4090 24GB

~$0.10

~140

A100 40GB

~$0.17

~200

Цены варьируются. Проверьте CLORE.AI Marketplacearrow-up-right для текущих тарифов.

Устранение неполадок

Недостаточно памяти

Плохое качество вывода

  • Увеличьте количество шагов (150-200)

  • Отрегулируйте CFG scale (попробуйте 5-10)

  • Будьте более конкретны в подсказке

  • Попробуйте другие seed'ы

Нет звука / тишина

  • Проверьте, достаточно ли подробна подсказка

  • Избегайте очень абстрактных описаний

  • Сначала попробуйте рабочие известные подсказки

Аудио-артефакты

  • Увеличьте количество шагов

  • Уменьшите CFG scale

  • Сократите длительность

  • Проверьте троттлинг GPU из-за температуры

Stable Audio vs Другие

Функция
Stable Audio
AudioCraft
Bark

Музыка

Отлично

Отлично

Плохо

SFX

Отлично

Хорошо

Плохо

Речь

Нет

Нет

Да

Длительность

47с / 3мин

30с

15с

Качество

44,1 кГц

32 кГц

24 кГц

Откройте

Частично

Да

Да

Используйте Stable Audio когда:

  • Генерация музыки высокого качества

  • Звуковые эффекты для игр/видео

  • Фоновая музыка

  • Атмосферные звуковые пейзажи

Дальнейшие шаги

  • AudioCraft - Генерация музыки от Meta

  • Bark TTS - Синтез речи

  • Demucs - Разделение аудио

  • Whisper - Распознавание речи

Последнее обновление

Это было полезно?