OpenVoice

Clona cualquier voz con segundos de audio usando OpenVoice en Clore.ai

Clona cualquier voz con solo segundos de audio usando OpenVoice.

circle-check

Alquilar en CLORE.AI

  1. Filtrar por tipo de GPU, VRAM y precio

  2. Elegir Bajo demanda (tarifa fija) o Spot (precio de puja)

  3. Configura tu pedido:

    • Selecciona imagen Docker

    • Establece puertos (TCP para SSH, HTTP para interfaces web)

    • Agrega variables de entorno si es necesario

    • Introduce el comando de inicio

  4. Selecciona pago: CLORE, BTC, o USDT/USDC

  5. Crea el pedido y espera el despliegue

Accede a tu servidor

  • Encuentra los detalles de conexión en Mis Pedidos

  • Interfaces web: Usa la URL del puerto HTTP

  • SSH: ssh -p <port> root@<proxy-address>

¿Qué es OpenVoice?

OpenVoice de MyShell puede:

  • Clonar voces a partir de ~10 segundos de audio

  • Controlar emoción, acento, ritmo

  • Clonación de voz cross-lingual

  • Conversión de voz zero-shot

Requisitos

Tarea
VRAM mínima
Recomendado

Inferencia

4GB

RTX 3060

Procesamiento por lotes

6GB

RTX 3070

Despliegue rápido

Imagen Docker:

Puertos:

Comando:

Accediendo a tu servicio

Después del despliegue, encuentra tu http_pub URL en Mis Pedidos:

  1. Ir a Mis Pedidos página

  2. Haz clic en tu pedido

  3. Encuentra la http_pub URL (por ejemplo, abc123.clorecloud.net)

Usa https://TU_HTTP_PUB_URL en lugar de localhost en los ejemplos abajo.

Instalación

Clonación básica de voz

Con Texto a Voz

Generar habla en cualquier voz:

Soporte multilingüe

Control de emoción

OpenVoice V2 admite control de emoción/estilo:

Procesamiento por lotes

Servidor API

Consejos de calidad

Para mejores resultados

  • Use 10-30 segundos de audio de referencia claro

  • Evite el ruido de fondo

  • Solo un hablante en la referencia

  • Aproximar el ritmo de habla

Preprocesamiento de audio

Comparación con otras herramientas

Función
OpenVoice
RVC
Bark

Audio de referencia

10-30s

10+ min

N/A

Entrenamiento

No requerido

Requerido

N/A

Velocidad

Rápido

Medio

Lento

Calidad

Genial

Mejor

Bueno

Cross-lingual

Limitado

Rendimiento

Tarea
GPU
Tiempo

Extraer embedding

RTX 3090

~1s

Convertir 10s de audio

RTX 3090

~2s

Convertir 1 min de audio

RTX 3090

~8s

Solución de problemas

Pobre coincidencia de voz

  • Usar audio de referencia más largo

  • Asegurar calidad de audio clara

  • Comprobar ruido de fondo

Artefactos de audio

  • Reducir ajustes de velocidad/enfasis

  • Usar formato de audio consistente

  • Comprobar coincidencia de la tasa de muestreo

Memoria insuficiente

  • Procesar clips más cortos

  • Reducir el tamaño del lote

  • Limpiar caché de CUDA

Estimación de costos

Tarifas típicas del marketplace de CLORE.AI (a fecha de 2024):

GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Los precios varían según el proveedor y la demanda. Consulta CLORE.AI Marketplacearrow-up-right para las tarifas actuales.

Ahorra dinero:

  • Usa Spot market para cargas de trabajo flexibles (a menudo 30-50% más barato)

  • Paga con CLORE tokens

  • Compara precios entre diferentes proveedores

Próximos pasos

Última actualización

¿Te fue útil?