Transcripción con Whisper
Transcribe audio y video con OpenAI Whisper en las GPUs de Clore.ai
Requisitos del servidor
Parámetro
Mínimo
Recomendado
¿Qué es Whisper?
Tamaños de modelos
Modelo
VRAM
Velocidad
Calidad
Notas
Usando large-v3-turbo
WhisperX: Alternativa mejorada
Despliegue rápido (Recomendado)
Verificar que funciona
Transcribir vía API
Referencia completa de la API (Faster-Whisper-Server)
Endpoints
Endpoint
Método
Descripción
Listar modelos disponibles
Documentación Swagger
Opciones de transcripción
Parámetro
Tipo
Descripción
Formatos de respuesta
Alternativa: Instalación manual
Uso básico (SSH)
Transcribir con marcas de tiempo
Subir archivos de audio
API de Python
Faster-Whisper (Recomendado)
Opciones de idioma
Traducción al inglés
Generación de subtítulos
Formato SRT
Formato VTT
Marcas de tiempo a nivel de palabra
Diarización de hablantes
Servidor REST API
Benchmarks de rendimiento
Modelo
GPU
Audio de 1 hora
Procesamiento eficiente en memoria
Descargar resultados
Solución de problemas
HTTP 502 en la URL http_pub
Precisión baja
Procesamiento lento
Estimación de costos
GPU
VRAM
Precio/día
Bueno para
Última actualización
¿Te fue útil?