Clon de voz RVC

Clona y convierte voces con RVC en GPUs de Clore.ai

Clona y convierte voces usando Conversion de Voz basada en Recuperación.

circle-check

Alquiler en CLORE.AI

  1. Filtrar por tipo de GPU, VRAM y precio

  2. Elegir Bajo demanda (tarifa fija) o Spot (precio de oferta)

  3. Configura tu pedido:

    • Selecciona la imagen de Docker

    • Configura los puertos (TCP para SSH, HTTP para interfaces web)

    • Agrega variables de entorno si es necesario

    • Introduce el comando de inicio

  4. Selecciona el pago: CLORE, BTC, o USDT/USDC

  5. Crea el pedido y espera el despliegue

Accede a tu servidor

  • Encuentra los detalles de conexión en Mis Pedidos

  • Interfaces web: Usa la URL del puerto HTTP

  • SSH: ssh -p <port> root@<proxy-address>

¿Qué es RVC?

RVC (Conversion de Voz basada en Recuperación) puede:

  • Clonar cualquier voz con entrenamiento mínimo

  • Convertir voces cantadas/habladas

  • Conversión de voz en tiempo real

  • Salida de alta calidad

Requisitos

Tarea
VRAM mínima
Recomendado

Inferencia

4GB

RTX 3060

Entrenamiento

8GB

RTX 3090

Tiempo real

6GB

RTX 3070

Despliegue rápido

Imagen de Docker:

Puertos:

Comando:

Accediendo a tu servicio

Después del despliegue, encuentra tu http_pub URL en Mis Pedidos:

  1. Ir a Mis Pedidos página

  2. Haz clic en tu pedido

  3. Encuentra la http_pub URL (por ejemplo, abc123.clorecloud.net)

Usa https://YOUR_HTTP_PUB_URL en lugar de localhost en los ejemplos a continuación.

Instalación

Conversión de Voz (Inferencia)

Usando la interfaz web

  1. Abrir http://<proxy>:7865

  2. Ir a la pestaña "Model Inference"

  3. Subir archivo de audio

  4. Seleccionar modelo de voz

  5. Ajustar configuraciones

  6. Hacer clic en "Convert"

API de Python

Entrenamiento de Voz Personalizada

Preparar conjunto de datos

  1. Recopila 10-30 minutos de audio limpio

  2. Corta en clips de 5-15 segundos

  3. Elimina ruido de fondo/música

Entrenar vía interfaz web

  1. Ir a la pestaña "Train"

  2. Introduce el nombre del experimento

  3. Configura la ruta de la carpeta de entrenamiento

  4. Haz clic en "Process data"

  5. Haz clic en "Feature extraction"

  6. Haz clic en "Train"

Entrenar vía línea de comandos

Parámetros de Entrenamiento

Parámetro
Descripción
Recomendado

Frecuencia de muestreo

Calidad de audio

48000

Tamaño de lote

Lote de entrenamiento

8-16

Épocas

Iteraciones de entrenamiento

200-500

Guardar cada

Frecuencia de checkpoints

20-50

Método f0

Extracción de tono

rmvpe

Métodos F0

Método
Calidad
Velocidad
Mejor para

pm

OK

Rápido

Pruebas

harvest

Bueno

Lento

General

crepe

Genial

Medio

Canto

rmvpe

Mejor

Medio

Todo

Conversión en tiempo real

Configuración

Formatos de modelo

Convertir a ONNX

Preprocesamiento de audio

Eliminar ruido

Normalizar volumen

Eliminar silencio

Procesamiento por lotes

Conversión de voz para canto

Para canciones, usa configuraciones apropiadas:

Problemas comunes

La voz suena robótica

  • Usa audio fuente de mayor calidad

  • Aumenta el valor de protect (0.4-0.5)

  • Prueba un método f0 diferente

Problemas de tono

  • Ajusta f0_up_key

  • Usa el método f0 rmvpe

  • Asegura un tono consistente en los datos de entrenamiento

Calidad de audio

  • Usa frecuencia de muestreo de 48 kHz

  • Elimina ruido de fondo de los datos de entrenamiento

  • Entrena por más épocas

Servidor API

Consejos de entrenamiento

Para mejor calidad

  • Usa más de 20 minutos de audio limpio

  • Elimina todo el ruido de fondo

  • Configuración de micrófono/grabación consistente

  • Incluye expresiones/emociones variadas

Para entrenamiento más rápido

  • Usa tamaño de lote 8-16

  • Habilita precisión mixta

  • Usa SSD NVMe para el conjunto de datos

Rendimiento

Tarea
GPU
Tiempo

Inferencia (1 min de audio)

RTX 3090

~5s

Entrenamiento (conjunto de 30 min)

RTX 3090

~2 horas

Conversión en tiempo real

RTX 3070

latencia <50ms

Solución de problemas

Estimación de costos

Tarifas típicas del marketplace de CLORE.AI (a fecha de 2024):

GPU
Tarifa por hora
Tarifa diaria
Sesión de 4 horas

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Los precios varían según el proveedor y la demanda. Consulta CLORE.AI Marketplacearrow-up-right para tarifas actuales.

Ahorra dinero:

  • Usa Spot mercado para cargas de trabajo flexibles (a menudo 30-50% más barato)

  • Paga con CLORE tokens

  • Compara precios entre distintos proveedores

Próximos pasos

Última actualización

¿Te fue útil?