# 音频与语音

- [概览](/guides/guides_v2-zh/yin-pin-yu-yu-yin/audio-voice.md)
- [Whisper 转录](/guides/guides_v2-zh/yin-pin-yu-yu-yin/whisper-transcription.md): 在 Clore.ai 的 GPU 上使用 OpenAI Whisper 转录音频和视频
- [带说话人分离的 WhisperX](/guides/guides_v2-zh/yin-pin-yu-yu-yin/whisperx.md): 在 Clore.ai 的 GPU 上运行 WhisperX，实现快速语音转录，并提供词级时间戳和说话人分离。
- [Bark TTS](/guides/guides_v2-zh/yin-pin-yu-yu-yin/bark-tts.md): 在 Clore.ai 上使用 Bark AI 生成逼真的语音和音频
- [XTTS（Coqui）](/guides/guides_v2-zh/yin-pin-yu-yu-yin/xtts-coqui.md): 使用 Coqui XTTS 通过声音克隆生成自然语音
- [F5-TTS](/guides/guides_v2-zh/yin-pin-yu-yu-yin/f5-tts.md): 在 Clore.ai 的 GPU 上使用 F5-TTS 进行快速流畅的文本转语音
- [Zonos TTS 声音克隆](/guides/guides_v2-zh/yin-pin-yu-yu-yin/zonos-tts.md): 在 Clore.ai 的 GPU 上运行 Zyphra 的 Zonos TTS，实现带情感和音高控制的声音克隆。
- [OpenVoice](/guides/guides_v2-zh/yin-pin-yu-yu-yin/openvoice-clone.md): 在 Clore.ai 上仅凭几秒钟音频即可克隆任何声音，使用 OpenVoice
- [RVC 声音克隆](/guides/guides_v2-zh/yin-pin-yu-yu-yin/rvc-voice-clone.md): 在 Clore.ai 的 GPU 上使用 RVC 克隆和转换声音
- [Demucs 分离](/guides/guides_v2-zh/yin-pin-yu-yu-yin/demucs-separation.md): 使用 Demucs 将音乐分离为人声、鼓、贝斯等
- [AudioCraft 音乐](/guides/guides_v2-zh/yin-pin-yu-yu-yin/audiocraft-music.md): 在 Clore.ai 上使用 Meta 的 AudioCraft 生成音乐和音频
- [Stable Audio](/guides/guides_v2-zh/yin-pin-yu-yu-yin/stable-audio.md): 在 Clore.ai 上使用 Stable Audio 生成音乐和音效
- [Dia TTS（Nari Labs）](/guides/guides_v2-zh/yin-pin-yu-yu-yin/dia-tts.md): 使用 Nari Labs 的 Dia TTS 生成带情感的多说话人对话
- [Qwen3-TTS 声音克隆](/guides/guides_v2-zh/yin-pin-yu-yu-yin/qwen3-tts.md): 使用 Qwen3-TTS 进行多语言声音克隆和 TTS——支持 10+ 语言、流式输出和情感控制
- [Kokoro TTS](/guides/guides_v2-zh/yin-pin-yu-yu-yin/kokoro-tts.md): 在 Clore.ai 的 GPU 上运行 Kokoro TTS——一个超轻量级 8200 万参数文本转语音模型。
- [ChatTTS 对话式语音](/guides/guides_v2-zh/yin-pin-yu-yu-yin/chattts.md): 在 Clore.ai 的 GPU 上运行 ChatTTS 对话式文本转语音，并提供精细的韵律控制。
- [Chatterbox 声音克隆](/guides/guides_v2-zh/yin-pin-yu-yu-yin/chatterbox-tts.md): 在 Clore.ai 的 GPU 上运行 Resemble AI 的 Chatterbox TTS，实现零样本声音克隆和多语言语音合成。
- [Kani-TTS-2 声音克隆](/guides/guides_v2-zh/yin-pin-yu-yu-yin/kani-tts.md): 在 Clore.ai 的 GPU 上运行 Kani-TTS-2——一个超高效的 4 亿参数文本转语音模型，支持声音克隆
- [MiniMax Speech 2.6](/guides/guides_v2-zh/yin-pin-yu-yu-yin/minimax-speech.md): 在 Clore.ai GPU 服务器上部署 MiniMax Speech 2.6——超低延迟语音代理 TTS
- [Fish Speech](/guides/guides_v2-zh/yin-pin-yu-yu-yin/fish-speech.md): 在 Clore.ai 的 GPU 上运行 Fish Speech 多语言 TTS 和零样本声音克隆
- [StyleTTS2](/guides/guides_v2-zh/yin-pin-yu-yu-yin/styletss2.md): 在 Clore.ai 的 GPU 上通过风格扩散运行 StyleTTS2，实现接近人类水平的文本转语音
- [MeloTTS](/guides/guides_v2-zh/yin-pin-yu-yu-yin/melotts.md): 在 Clore.ai 的 GPU 上运行 MeloTTS 高质量多语言 TTS，推理速度快
- [Voxtral TTS](/guides/guides_v2-zh/yin-pin-yu-yu-yin/voxtral-tts.md)
