Clasificar automáticamente preguntas de StackOverflow con múltiples etiquetas (Python, JavaScript, CSS, etc.
Clasificar automáticamente preguntas de StackOverflow con múltiples etiquetas (Python, JavaScript, CSS, etc.) a partir del texto de la pregunta. Con 100 etiquetas posibles y la posibilidad de que una pregunta tenga varias simultáneamente, es un problema de clasificación multi-etiqueta no trivial.
Sistema de clasificación multi-etiqueta en dos partes: preprocesamiento del texto (tokenización, eliminación de stopwords, TF-IDF) y entrenamiento de modelos scikit-learn configurados para multi-etiqueta. Evaluación con métricas apropiadas para clasificación multi-etiqueta.