Bark TTS

在 Clore.ai 使用 Bark AI 生成逼真语音与音频

使用 Bark AI 生成逼真的语音和音频。

circle-check

服务器要求

参数
最低
推荐

内存

8GB

16GB+

显存

4GB(小型)

8GB以上(正常)

网络

200Mbps

500Mbps+

启动时间

3-5 分钟

-

circle-exclamation

在 CLORE.AI 上租用

  1. 按 GPU 类型、显存和价格筛选

  2. 选择 按需 (固定费率)或 竞价 (出价价格)

  3. 配置您的订单:

    • 选择 Docker 镜像

    • 设置端口(用于 SSH 的 TCP,Web 界面的 HTTP)

    • 如有需要,添加环境变量

    • 输入启动命令

  4. 选择支付方式: CLORE, BTC,或 USDT/USDC

  5. 创建订单并等待部署

访问您的服务器

  • 在以下位置查找连接详情: 我的订单

  • Web 界面:使用 HTTP 端口的 URL

  • SSH: ssh -p <port> root@<proxy-address>

什么是 Bark?

Suno AI 的 Bark 可以生成:

  • 多语言的逼真语音

  • 多种说话人音色

  • 非语言声音(笑声、叹气)

  • 音乐和音效

  • 多语种语音

要求

质量
显存
推荐

4GB

按小时费率

正常

8GB

RTX 3070

12GB

速度

快速部署

Docker 镜像:

端口:

命令:

访问您的服务

部署后,在以下位置查找您的 http_pub URL: 我的订单:

  1. 前往 我的订单 页面

  2. 单击您的订单

  3. 查找 http_pub URL(例如, abc123.clorecloud.net)

使用 https://YOUR_HTTP_PUB_URL 而不是 localhost 在下面的示例中。

验证是否正常运行

circle-exclamation

安装

基本用法

语音选择

内置声音

可用语言

语言
代码
说话人

英语

en

0-9

德语

de

0-9

西班牙语

es

0-9

法语

fr

0-9

印地语

hi

0-9

意大利语

it

0-9

日语

ja

0-9

韩语

ko

0-9

波兰语

pl

0-9

葡萄牙语

pt

0-9

俄语

ru

0-9

土耳其语

tr

0-9

中文

zh

0-9

非语言声音

Bark 可以生成非语言音频:

长篇音频

对于超过 13 秒的文本:

语音克隆

创建自定义声音提示:

"专业影棚柔光箱"

API 服务器

用法

内存优化

针对有限显存

启用 FP16

与其他音频结合

background = Image.open("studio_bg.jpg")

模式
GPU
时间(10 个词)

正常

速度

~5s

正常

512x512

~3s

按小时费率

~8s

CPU

-

~60 秒

与其他 TTS 的比较

特性
Bark
Coqui
Piper

质量

最佳

很棒

良好

性能

中等

快速

语言

13+

20+

30+

非语言

显存

8GB+

4GB

1GB

# 使用固定种子以获得一致结果

内存不足

生成速度慢

  • 使用 GPU(而非 CPU)

  • 在多次生成之间保持模型加载

  • 生成更短的片段

音频质量问题

  • 尝试不同的说话人

  • 将长文本拆分为句子

  • 避免特殊字符

下载所有所需的检查点

检查文件完整性

GPU
验证 CUDA 兼容性
费用估算
CLORE.AI 市场的典型费率(截至 2024 年):

按小时费率

~$0.03

~$0.70

~$0.12

速度

~$0.06

~$1.50

~$0.25

512x512

~$0.10

~$2.30

~$0.40

按日费率

~$0.17

~$4.00

~$0.70

4 小时会话

~$0.25

~$6.00

~$1.00

RTX 3060 CLORE.AI 市场arrow-up-right A100 40GB

A100 80GB

  • 使用 竞价 价格随提供商和需求而异。请查看

  • 以获取当前费率。 CLORE 节省费用:

  • 市场用于灵活工作负载(通常便宜 30-50%)

使用以下方式支付

最后更新于

这有帮助吗?