Segmentación de datos, reducción de dimensionalidad, detección de anomalías y reglas de asociación sin etiquetas.
Datos sin etiquetas: la mayoría de los datos del mundo real no vienen con respuestas correctas. El reto es encontrar estructura oculta — grupos naturales, dimensiones latentes relevantes, observaciones anómalas, patrones de co-ocurrencia — sin ninguna señal supervisada que guíe el aprendizaje.
Algoritmos de clustering para segmentación (K-Means para grupos esféricos, DBSCAN para formas arbitrarias, clustering jerárquico para jerarquías visuales), reducción de dimensionalidad con PCA y análisis factorial, análisis de correspondencias para variables categóricas, Isolation Forest para detección de anomalías, y algoritmo Apriori para reglas de asociación.
Agrupar cereales de desayuno por sus características nutricionales (calorías, proteínas, grasas, fib…
Ver proyecto →Un dataset de vehículos con múltiples características técnicas (cilindrada, potencia, peso, consumo,…
Ver proyecto →Los récords atléticos nacionales de mujeres en distintas pruebas (100m, 200m, 400m, 800m, 1500m, mar…
Ver proyecto →En el análisis de series temporales financieras, detectar anomalías — días con comportamientos atípi…
Ver proyecto →Identificar las zonas geográficas óptimas para abrir nuevos centros comerciales requiere agrupar áre…
Ver proyecto →Identificar qué productos tienden a comprarse juntos en un supermercado sin ninguna variable de clas…
Ver proyecto →Dos problemas distintos: (1) analizar la percepción de marcas de café en atributos cualitativos (tab…
Ver proyecto →