AudioCraft 音乐

在 Clore.ai 上使用 Meta 的 AudioCraft 生成音乐和音频

使用 Meta 的 AudioCraft(MusicGen)生成音乐和音频。

circle-check

在 CLORE.AI 上租用

  1. 按 GPU 类型、显存和价格筛选

  2. 选择 按需 (固定费率)或 竞价 (出价价格)

  3. 配置您的订单:

    • 选择 Docker 镜像

    • 设置端口(用于 SSH 的 TCP,Web 界面的 HTTP)

    • 如有需要,添加环境变量

    • 输入启动命令

  4. 选择支付方式: CLORE, BTC,或 USDT/USDC

  5. 创建订单并等待部署

访问您的服务器

  • 在以下位置查找连接详情: 我的订单

  • Web 界面:使用 HTTP 端口的 URL

  • SSH: ssh -p <port> root@<proxy-address>

什么是 AudioCraft?

AudioCraft 包含:

  • MusicGen - 文本到音乐的生成

  • AudioGen - 音效生成

  • EnCodec - 音频压缩

  • MAGNeT - 更快的生成

模型规模

A100
显存
质量
性能

small

4GB

良好

快速

medium

8GB

很棒

中等

large

16GB

最佳

旋律

8GB

Great + melody

中等

快速部署

Docker 镜像:

端口:

命令:

访问您的服务

部署后,在以下位置查找您的 http_pub URL: 我的订单:

  1. 前往 我的订单 页面

  2. 单击您的订单

  3. 查找 http_pub URL(例如, abc123.clorecloud.net)

使用 https://YOUR_HTTP_PUB_URL 而不是 localhost 在下面的示例中。

安装

MusicGen:文本到音乐

基础生成

多重提示

旋律条件化

使用旋律作为参考:

续写

从现有音频继续:

AudioGen:音效

生成参数

参数影响

参数
低值
高值

temperature

保守

有创造性

top_k

更集中

更多变化

cfg_coef

宽松的解读

严格遵循提示

"专业影棚柔光箱"

流式生成

立体声生成

API 服务器

提示工程

有效的提示

不良提示

后期处理

合并片段

添加效果

内存优化

background = Image.open("studio_bg.jpg")

A100
GPU
30 秒生成

small

速度

~10 秒

medium

速度

~25 秒

large

512x512

~45s

旋律

速度

~30s

比较

特性
MusicGen
Stable Audio
Riffusion

质量

很棒

很棒

良好

长度

30 秒

90 秒

循环

旋律输入

开源

# 使用固定种子以获得一致结果

内存不足

  • 使用更小的模型(使用 small 而不是 large)

  • 减少时长

  • 清除缓存: torch.cuda.empty_cache()

质量差

  • 使用更具体的提示

  • 尝试 medium 或 large 模型

  • 调整温度(0.8-1.2)

重复的输出

  • 增加 top_k

  • 降低 cfg_coef

  • 尝试不同的提示

下载所有所需的检查点

检查文件完整性

GPU
验证 CUDA 兼容性
费用估算
CLORE.AI 市场的典型费率(截至 2024 年):

按小时费率

~$0.03

~$0.70

~$0.12

速度

~$0.06

~$1.50

~$0.25

512x512

~$0.10

~$2.30

~$0.40

按日费率

~$0.17

~$4.00

~$0.70

4 小时会话

~$0.25

~$6.00

~$1.00

RTX 3060 CLORE.AI 市场arrow-up-right A100 40GB

A100 80GB

  • 使用 竞价 价格随提供商和需求而异。请查看

  • 以获取当前费率。 CLORE 节省费用:

  • 市场用于灵活工作负载(通常便宜 30-50%)

使用以下方式支付

最后更新于

这有帮助吗?