🔍 ML No Supervisado
🔍 ML No Supervisado

Clustering de cereales con K-Means

Agrupar cereales de desayuno por sus características nutricionales (calorías, proteínas, grasas, fibra, azúcar, sodio) sin etiquetas predefinidas — el objetivo es encontrar grupos naturales que permitan comparar el perfil nutricional de los productos de forma sistemática.

Problema

Agrupar cereales de desayuno por sus características nutricionales (calorías, proteínas, grasas, fibra, azúcar, sodio) sin etiquetas predefinidas — el objetivo es encontrar grupos naturales que permitan comparar el perfil nutricional de los productos de forma sistemática.

Solución

K-Means sobre datos nutricionales de cereales: selección óptima de K con el método del codo (inertia) y silhouette score, seguido de perfilado de cada cluster para identificar qué grupos representan cereales saludables, intermedios y de alto contenido calórico.

Preprocesamiento y selección de K

  • Escalado StandardScaler — K-Means es sensible a la escala de las features nutricionales
  • Método del codo: inertia vs. K para detectar el punto de rendimientos decrecientes
  • Silhouette score por K para confirmar la separabilidad entre clusters
  • Múltiples inicializaciones (n_init=10) para evitar mínimos locales

Perfilado de segmentos

  • Análisis de centroides: perfil nutricional medio de cada cluster
  • Heatmaps de centroides para comparar visualmente los grupos de cereales
  • Identificación de clusters: cereales saludables vs. alto azúcar vs. equilibrados
  • Distribución de features por cluster con violin plots para validar homogeneidad interna

Más proyectos en ML No Supervisado