Stable Audio

Genera música y efectos de sonido con Stable Audio en Clore.ai

Genera música y efectos de sonido con Stable Audio de Stability AI en GPUs de CLORE.AI.

circle-check

¿Por qué Stable Audio?

  • Alta calidad - Generación de audio estéreo a 44,1 kHz

  • Longitud variable - Genera hasta 95 segundos

  • Versátil - Música, efectos de sonido, sonidos ambientales

  • Texto a audio - Describe lo que quieres escuchar

  • Pesos abiertos - Stable Audio Open disponible

Variantes de modelo

Modelo
Duración
Calidad
VRAM
Licencia

Stable Audio Open

47 seg

Bueno

8GB

Abrir

Stable Audio 2.0

3 min

Excelente

12GB

Comercial

Despliegue rápido en CLORE.AI

Imagen Docker:

pytorch/pytorch:2.5.1-cuda12.4-cudnn9-devel

Puertos:

Comando:

Accediendo a tu servicio

Después del despliegue, encuentra tu http_pub URL en Mis Pedidos:

  1. Ir a Mis Pedidos página

  2. Haz clic en tu pedido

  3. Encuentra la http_pub URL (por ejemplo, abc123.clorecloud.net)

Usa https://TU_HTTP_PUB_URL en lugar de localhost en los ejemplos abajo.

Requisitos de hardware

Modelo
GPU mínima
Recomendado

Stable Audio Open

RTX 3070 8GB

RTX 3090 24GB

Stable Audio 2.0

RTX 3090 12GB

RTX 4090 24GB

Instalación

Uso básico

Texto a música

Efectos de sonido

Sonidos ambientales

Ejemplos de prompts

Géneros musicales

Efectos de sonido

Ambiental/Fondo

Opciones avanzadas

Controlando la generación

Longitud variable

Generación por lotes

Interfaz web Gradio

Rendimiento

Duración
Pasos
GPU
Tiempo

10 seg

100

RTX 3090

~15s

10 seg

100

RTX 4090

~10s

30 seg

100

RTX 3090

~40s

30 seg

100

RTX 4090

~25s

47 seg

100

RTX 4090

~40s

Consejos de calidad

Mejor música

Mejores efectos de sonido

Estimación de costos

Tarifas típicas del mercado de CLORE.AI:

GPU
Tarifa por hora
~30 seg clips/hora

RTX 3060 12GB

~$0.03

~50

RTX 3090 24GB

~$0.06

~90

RTX 4090 24GB

~$0.10

~140

A100 40GB

~$0.17

~200

Los precios varían. Consulta CLORE.AI Marketplacearrow-up-right para las tarifas actuales.

Solución de problemas

Memoria insuficiente

Salida de baja calidad

  • Aumenta los pasos (150-200)

  • Ajusta la escala CFG (prueba 5-10)

  • Sé más específico en el prompt

  • Prueba diferentes semillas

Sin sonido / Silencio

  • Verifica que el prompt sea lo suficientemente descriptivo

  • Evita descripciones muy abstractas

  • Prueba primero prompts que sepas que funcionan

Artefactos de audio

  • Aumenta los pasos

  • Reduce la escala CFG

  • Reduce la duración

  • Verifica el estrangulamiento térmico de la GPU

Stable Audio frente a otros

Función
Stable Audio
AudioCraft
Bark

Música

Excelente

Excelente

Pobre

Efectos

Genial

Bueno

Pobre

Voz

No

No

Duración

47 s / 3 min

30 s

15 s

Calidad

44,1 kHz

32 kHz

24 kHz

Abrir

Parcial

Usa Stable Audio cuando:

  • Generación de música de alta calidad

  • Efectos de sonido para juegos/video

  • Música de fondo

  • Paisajes sonoros ambientales

Próximos pasos

Última actualización

¿Te fue útil?