OpenVoice

Клонируйте любой голос по нескольким секундам аудио с OpenVoice на Clore.ai

Клонируйте любой голос за считанные секунды аудио с помощью OpenVoice.

circle-check

Аренда на CLORE.AI

  1. Отфильтруйте по типу GPU, объему VRAM и цене

  2. Выберите On-Demand (фиксированная ставка) или Spot (цена по ставке)

  3. Настройте ваш заказ:

    • Выберите Docker-образ

    • Установите порты (TCP для SSH, HTTP для веб-интерфейсов)

    • Добавьте переменные окружения при необходимости

    • Введите команду запуска

  4. Выберите способ оплаты: CLORE, BTC, или USDT/USDC

  5. Создайте заказ и дождитесь развертывания

Доступ к вашему серверу

  • Найдите данные для подключения в Моих заказах

  • Веб-интерфейсы: используйте URL HTTP-порта

  • SSH: ssh -p <port> root@<proxy-address>

Что такое OpenVoice?

OpenVoice от MyShell может:

  • Клонировать голоса с примерно 10 секунд аудио

  • Управлять эмоцией, акцентом, ритмом

  • Кросс-языковое клонирование голоса

  • Zero-shot преобразование голоса

Требования

Задача
Мин. VRAM
Рекомендуется

Вывод (Inference)

4 ГБ

RTX 3060

Пакетная обработка

6 ГБ

RTX 3070

Быстрое развертывание

Docker-образ:

Порты:

Команда:

Доступ к вашему сервису

После развертывания найдите ваш http_pub URL в Моих заказах:

  1. Перейдите на Моих заказах страницу

  2. Нажмите на ваш заказ

  3. Найдите http_pub URL (например, abc123.clorecloud.net)

Используйте https://YOUR_HTTP_PUB_URL вместо localhost в примерах ниже.

Установка

Базовое клонирование голоса

С синтезом речи (Text-to-Speech)

Генерировать речь в любом голосе:

Поддержка нескольких языков

Управление эмоциями

OpenVoice V2 поддерживает управление эмоцией/стилем:

Пакетная обработка

API-сервер

Советы по качеству

Для наилучших результатов

  • Используйте 10–30 секунд чистого референсного аудио

  • Избегайте фонового шума

  • В референсе должен быть только один говорящий

  • Примерно совпадайте со скоростью речи

Предобработка аудио

Сравнение с другими инструментами

Функция
OpenVoice
RVC
Bark

Референсное аудио

10–30 с

10+ мин

N/A

Обучение

Не требуется

Требуется

N/A

Скорость

Быстро

Средне

Медленно

Качество

Отлично

Лучшее

Хорошо

Кросс-языковое

Да

Ограничено

Да

Производительность

Задача
GPU
Время

Извлечь эмбеддинг

RTX 3090

~1 с

Преобразовать 10 с аудио

RTX 3090

~2s

Преобразовать 1 мин аудио

RTX 3090

~8s

Устранение неполадок

Плохое соответствие голоса

  • Используйте более длинное референсное аудио

  • Обеспечьте чистое качество аудио

  • Проверьте наличие фонового шума

Аудио-артефакты

  • Уменьшите настройки скорости/ударения

  • Используйте единообразный формат аудио

  • Проверьте соответствие частоты дискретизации

Недостаточно памяти

  • Обрабатывайте более короткие клипы

  • Уменьшите размер батча

  • Очистите кеш CUDA

Оценка стоимости

Типичные ставки на маркетплейсе CLORE.AI (по состоянию на 2024):

GPU
Почасовая ставка
Дневная ставка
Сессия 4 часа

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Цены варьируются в зависимости от провайдера и спроса. Проверьте CLORE.AI Marketplacearrow-up-right для текущих тарифов.

Экономьте деньги:

  • Используйте Spot рынок для гибких рабочих нагрузок (часто на 30–50% дешевле)

  • Платите с помощью CLORE токенов

  • Сравнивайте цены у разных провайдеров

Дальнейшие шаги

Последнее обновление

Это было полезно?