🔍 ML No Supervisado

Clustering de cereales con K-Means

Agrupar cereales de desayuno por sus características nutricionales (calorías, proteínas, grasas, fibra, azúcar, sodio) sin etiquetas predefinidas — el objetivo es encontrar grupos naturales que permitan comparar el perfil nutricional de los productos de forma sistemática.

Problema

Solución

K-Means sobre datos nutricionales de cereales: selección óptima de K con el método del codo (inertia) y silhouette score, seguido de perfilado de cada cluster para identificar qué grupos representan cereales saludables, intermedios y de alto contenido calórico.

Preprocesamiento y selección de K

Escalado StandardScaler — K-Means es sensible a la escala de las features nutricionales
Método del codo: inertia vs. K para detectar el punto de rendimientos decrecientes
Silhouette score por K para confirmar la separabilidad entre clusters
Múltiples inicializaciones (n_init=10) para evitar mínimos locales

Perfilado de segmentos

Análisis de centroides: perfil nutricional medio de cada cluster
Heatmaps de centroides para comparar visualmente los grupos de cereales
Identificación de clusters: cereales saludables vs. alto azúcar vs. equilibrados
Distribución de features por cluster con violin plots para validar homogeneidad interna

Clustering de cereales con K-Means

Problema

Solución

Preprocesamiento y selección de K

Perfilado de segmentos

Análisis PCA de vehículos

Análisis factorial en récords atléticos