# Resumen

Procesamiento de audio impulsado por IA, síntesis de voz y clonación de voz en GPUs de CLORE.AI.

## Texto a voz

| Herramienta                                                                                | Descripción                                              | Calidad   |
| ------------------------------------------------------------------------------------------ | -------------------------------------------------------- | --------- |
| [Bark TTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/bark-tts)                 | TTS multilingüe expresivo                                | Excelente |
| [XTTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/xtts-coqui)                   | Clonación de voz + TTS                                   | Muy buena |
| [F5-TTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/f5-tts)                     | TTS rápido de cero disparos                              | Muy buena |
| [OpenVoice](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/openvoice-clone)         | Clonación instantánea de voz                             | Buena     |
| [Chatterbox TTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/chatterbox-tts)     | Clonación de voz de cero disparos                        | Buena     |
| [ChatTTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/chattts)                   | Síntesis de voz conversacional                           | Buena     |
| [Dia TTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/dia-tts)                   | Generación de diálogos con múltiples hablantes           | Buena     |
| [Fish Speech](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/fish-speech)           | Síntesis de voz de alta calidad                          | Muy buena |
| [Kani-TTS-2](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/kani-tts)               | TTS eficiente con clonación de voz                       | Buena     |
| [Kokoro TTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/kokoro-tts)             | TTS ligero ultrarrápido                                  | Buena     |
| [MeloTTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/melotts)                   | Síntesis de voz multilingüe                              | Buena     |
| [MiniMax Speech 2.6](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/minimax-speech) | TTS de nivel comercial                                   | Muy buena |
| [Qwen3-TTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/qwen3-tts)               | Clonación de voz multilingüe                             | Buena     |
| [StyleTTS2](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/styletss2)               | TTS controlable por estilo                               | Muy buena |
| [Voxtral TTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/voxtral-tts)           | TTS de código abierto de 4B, 9 idiomas, clonación en 3 s | Excelente |
| [Zonos TTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/zonos-tts)               | Clonación de voz con control de emoción                  | Buena     |

## Clonación de voz

| Herramienta                                                                        | Se requiere entrenamiento | Calidad   |
| ---------------------------------------------------------------------------------- | ------------------------- | --------- |
| [RVC](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/rvc-voice-clone)       | Sí                        | Excelente |
| [OpenVoice](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/openvoice-clone) | No                        | Buena     |
| [XTTS](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/xtts-coqui)           | No (muestra de 6 s)       | Muy buena |

## Procesamiento de audio

| Herramienta                                                                            | Caso de uso                                                  |
| -------------------------------------------------------------------------------------- | ------------------------------------------------------------ |
| [Whisper](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/whisper-transcription) | Transcripción de voz a texto                                 |
| [Demucs](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/demucs-separation)      | Separación de voces                                          |
| [AudioCraft](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/audiocraft-music)   | Generación de música                                         |
| [Stable Audio](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/stable-audio)     | Generación de música y sonidos con IA                        |
| [WhisperX](https://docs.clore.ai/guides/guides_v2-es/audio-y-voz/whisperx)             | Transcripción rápida con marcas de tiempo a nivel de palabra |

## Guías relacionadas

* [Cabezas parlantes](https://docs.clore.ai/guides/guides_v2-es/cabezas-parlantes/talking-heads) - Animar rostros con audio
