Bark TTS

Générez de la parole et de l'audio réalistes avec Bark AI sur Clore.ai

Générez une parole et un audio réalistes avec Bark AI.

circle-check

Exigences du serveur

Paramètre
Minimum
Recommandé

RAM

8 Go

16 Go+

VRAM

4Go (petit)

8 Go+ (normal)

Réseau

200 Mbps

500 Mbps+

Temps de démarrage

3-5 minutes

-

circle-exclamation

Location sur CLORE.AI

  1. Filtrer par type de GPU, VRAM et prix

  2. Choisir À la demande (tarif fixe) ou Spot (prix d'enchère)

  3. Configurez votre commande :

    • Sélectionnez l'image Docker

    • Définissez les ports (TCP pour SSH, HTTP pour les interfaces web)

    • Ajoutez des variables d'environnement si nécessaire

    • Entrez la commande de démarrage

  4. Sélectionnez le paiement : CLORE, BTC, ou USDT/USDC

  5. Créez la commande et attendez le déploiement

Accédez à votre serveur

  • Trouvez les détails de connexion dans Mes commandes

  • Interfaces Web : utilisez l'URL du port HTTP

  • SSH : ssh -p <port> root@<adresse-proxy>

Qu'est-ce que Bark ?

Bark de Suno AI peut générer :

  • Une parole réaliste en plusieurs langues

  • Diffantes voix de locuteurs

  • Sons non verbaux (rire, soupir)

  • Musique et effets sonores

  • Parole multilingue

Exigences

Qualité
VRAM
Recommandé

Faible

4 Go

RTX 3060

Normal

8 Go

RTX 3070

Élevé

12Go

RTX 3090

Déploiement rapide

Image Docker :

Ports :

Commande :

Accéder à votre service

Après le déploiement, trouvez votre http_pub URL dans Mes commandes:

  1. Aller à la Mes commandes page

  2. Cliquez sur votre commande

  3. Trouvez l' http_pub URL (par ex., abc123.clorecloud.net)

Utilisez https://VOTRE_HTTP_PUB_URL au lieu de localhost dans les exemples ci-dessous.

Vérifiez que cela fonctionne

circle-exclamation

Installation

Utilisation de base

Sélection de la voix

Voix intégrées

Langues disponibles

Langue
Code
Locuteurs

Anglais

en

0-9

Allemand

de

0-9

Espagnol

es

0-9

Français

fr

0-9

Hindi

hi

0-9

Italien

it

0-9

Japonais

ja

0-9

Coréen

ko

0-9

Polonais

pl

0-9

Portugais

pt

0-9

Russe

ru

0-9

Turc

tr

0-9

Chinois

zh

0-9

Sons non verbaux

Bark peut générer de l'audio non verbal :

Audio longue durée

Pour un texte plus long que 13 secondes :

Clonage de voix

Créer des invites vocales personnalisées :

Traitement par lots

Serveur API

Utilisation

Optimisation de la mémoire

Pour VRAM limitée

Activer FP16

Combinaison avec d'autres audio

Performances

Mode
GPU
Temps (10 mots)

Normal

RTX 3090

~5s

Normal

RTX 4090

~3s

Faible

RTX 3060

~8s

CPU

-

~60s

Comparaison avec d'autres TTS

Fonction
Bark
Coqui
Piper

Qualité

Meilleur

Excellent

Bon

Vitesse

Lent

Moyen

Rapide

Langues

13+

20+

30+

Non verbal

Oui

Non

Non

VRAM

8 Go+

4 Go

1Go

Dépannage

Mémoire insuffisante

Génération lente

  • Utiliser le GPU (pas le CPU)

  • Garder les modèles chargés entre les générations

  • Générer des segments plus courts

Problèmes de qualité audio

  • Essayer différents locuteurs

  • Diviser le texte long en phrases

  • Éviter les caractères spéciaux

Estimation des coûts

Tarifs typiques du marché CLORE.AI (à partir de 2024) :

GPU
Tarif horaire
Tarif journalier
Session de 4 heures

RTX 3060

~$0.03

~$0.70

~$0.12

RTX 3090

~$0.06

~$1.50

~$0.25

RTX 4090

~$0.10

~$2.30

~$0.40

A100 40GB

~$0.17

~$4.00

~$0.70

A100 80GB

~$0.25

~$6.00

~$1.00

Les prix varient selon le fournisseur et la demande. Vérifiez CLORE.AI Marketplacearrow-up-right pour les tarifs actuels.

Économisez de l'argent :

  • Utilisez Spot market pour les charges de travail flexibles (souvent 30-50 % moins cher)

  • Payer avec CLORE jetons

  • Comparer les prix entre différents fournisseurs

Prochaines étapes

Mis à jour

Ce contenu vous a-t-il été utile ?