Fish Speech
Ejecuta Fish Speech, TTS multilingüe y clonación de voz zero-shot en las GPU de Clore.ai
Requisitos del servidor
Parámetro
Mínimo
Recomendado
Despliegue rápido en CLORE.AI
1. Encuentra un servidor adecuado
2. Configura tu despliegue
3. Accede a la interfaz
Configuración paso a paso
Paso 1: Conéctate por SSH a tu servidor
Paso 2: Extraer y ejecutar el contenedor Docker
Paso 3: Verificar el acceso a la GPU
Paso 4: Comprobar la descarga del modelo
Paso 5: Acceder a la WebUI
Paso 6: (Opcional) Habilitar el servidor API
Ejemplos de uso
Ejemplo 1: Texto a voz básico vía WebUI
Ejemplo 2: Clonación de voz zero-shot
Ejemplo 3: TTS basado en API (Python)
Ejemplo 4: TTS multilingüe
Ejemplo 5: Procesamiento por lotes de archivos de audio
Configuración
Docker Compose (Configuración de Producción)
Opciones clave de configuración
Opción
Por defecto
Descripción
Variantes del modelo
Modelo
Tamaño
Idiomas
Notas
Consejos de rendimiento
1. Habilitar torch.compile para una inferencia más rápida
2. Usar media precisión (FP16)
3. Pre-cargar voces de referencia
4. Optimización de memoria GPU
5. Ajuste del tamaño de lote
Solución de problemas
Problema: El contenedor no arranca — CUDA no encontrado
Problema: Error por falta de memoria (OOM)
Problema: Puerto 7860 no accesible
Problema: La descarga del modelo falla / descarga lenta
Problema: La calidad de audio es pobre
Problema: La WebUI carga pero la generación se queda colgada
Enlaces
Recomendaciones de GPU en Clore.ai
Caso de uso
GPU recomendada
Coste estimado en Clore.ai
Última actualización
¿Te fue útil?