# 音频与语音

- [概览](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/audio-voice.md)
- [Whisper 转录](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/whisper-transcription.md): 在 Clore.ai 的 GPU 上使用 OpenAI Whisper 转录音频和视频
- [带说话人分离的 WhisperX](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/whisperx.md): 在 Clore.ai 的 GPU 上运行 WhisperX，进行快速语音转录，支持词级时间戳和说话人分离。
- [Bark TTS](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/bark-tts.md): 在 Clore.ai 上使用 Bark AI 生成逼真的语音和音频
- [XTTS（Coqui）](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/xtts-coqui.md): 使用 Coqui XTTS 进行带声音克隆的自然语音生成
- [F5-TTS](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/f5-tts.md): 在 Clore.ai 的 GPU 上使用 F5-TTS 实现快速流畅的文本转语音
- [Zonos TTS 声音克隆](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/zonos-tts.md): 在 Clore.ai 的 GPU 上运行 Zyphra 的 Zonos TTS，用于带情感和音高控制的声音克隆。
- [OpenVoice](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/openvoice-clone.md): 在 Clore.ai 上使用 OpenVoice 通过几秒音频克隆任意声音
- [RVC 声音克隆](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/rvc-voice-clone.md): 在 Clore.ai 的 GPU 上使用 RVC 克隆和转换声音
- [Demucs 分离](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/demucs-separation.md): 使用 Demucs 将音乐分离为人声、鼓、贝斯等
- [AudioCraft 音乐](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/audiocraft-music.md): 在 Clore.ai 上使用 Meta 的 AudioCraft 生成音乐和音频
- [Stable Audio](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/stable-audio.md): 在 Clore.ai 上使用 Stable Audio 生成音乐和音效
- [Dia TTS（Nari Labs）](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/dia-tts.md): 使用 Nari Labs 的 Dia TTS 生成带情感的多说话人对话
- [Qwen3-TTS 声音克隆](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/qwen3-tts.md): 使用 Qwen3-TTS 进行多语言声音克隆和 TTS——支持 10+ 语言、流式输出和情感控制
- [Kokoro TTS](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/kokoro-tts.md): 在 Clore.ai 的 GPU 上运行 Kokoro TTS——一个超轻量级的 8200 万参数文本转语音模型。
- [ChatTTS 对话语音](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/chattts.md): 在 Clore.ai 的 GPU 上运行 ChatTTS 对话式文本转语音，并提供细粒度韵律控制。
- [Chatterbox 声音克隆](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/chatterbox-tts.md): 在 Clore.ai 的 GPU 上运行 Resemble AI 的 Chatterbox TTS，用于零样本声音克隆和多语言语音合成。
- [Kani-TTS-2 声音克隆](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/kani-tts.md): 在 Clore.ai 的 GPU 上运行 Kani-TTS-2——一个超高效的 4 亿参数文本转语音模型，支持声音克隆
- [MiniMax Speech 2.6](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/minimax-speech.md): 在 Clore.ai 的 GPU 服务器上部署 MiniMax Speech 2.6——超低延迟语音智能体 TTS
- [Fish Speech](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/fish-speech.md): 在 Clore.ai 的 GPU 上运行 Fish Speech 多语言 TTS 和零样本声音克隆
- [StyleTTS2](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/styletss2.md): 在 Clore.ai 的 GPU 上通过风格扩散运行接近人类水平的文本转语音
- [MeloTTS](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/melotts.md): 在 Clore.ai 的 GPU 上运行 MeloTTS，高质量多语言 TTS，推理速度快
- [Voxtral TTS](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/voxtral-tts.md)
- [MOSS-TTS（仅 CPU，100M）](https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin/moss-tts.md): 在 Clore.ai 上运行 MOSS-TTS——来自 OpenMOSS（MOSI.AI + 复旦 NLP）的超轻量 1 亿参数、CPU 优先的多语言文本转语音模型。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.clore.ai/guides/guides_v2-zh/yin-pin-yu-yu-yin.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
