Construir aplicaciones web con modelos Transformer que combinen dos tareas de NLP: transcripción de audio con Whisper y clasificación zero-shot de texto — sin datos de entrenamiento etiquetados para la clasificación.
Construir aplicaciones web con modelos Transformer que combinen dos tareas de NLP: transcripción de audio con Whisper y clasificación zero-shot de texto — sin datos de entrenamiento etiquetados para la clasificación. El reto es integrarlos en una interfaz interactiva accesible.
Faster-Whisper para transcripción de audio de alta eficiencia + modelos Transformer de Hugging Face para clasificación zero-shot. Demo completa con Gradio: un clasificador de audios zero-shot que transcribe y luego clasifica el contenido sin necesidad de fine-tuning.