🔍 ML No Supervisado
🔍 ML No Supervisado

Análisis PCA de vehículos

Un dataset de vehículos con múltiples características técnicas (cilindrada, potencia, peso, consumo, aceleración) tiene alta correlación entre variables: la redundancia dificulta la visualización y puede inflar la importancia de features correlacionadas.

Problema

Un dataset de vehículos con múltiples características técnicas (cilindrada, potencia, peso, consumo, aceleración) tiene alta correlación entre variables: la redundancia dificulta la visualización y puede inflar la importancia de features correlacionadas. Se necesita reducir la dimensionalidad preservando la información.

Solución

PCA (Principal Component Analysis) para encontrar las componentes de máxima varianza en los datos de vehículos y proyectarlos a un espacio reducido. Biplot para visualizar qué características contribuyen a cada componente e identificar tipos de vehículos en el espacio reducido.

Análisis de componentes

  • Varianza explicada por componente y acumulada — scree plot para selección de n_components
  • Loadings (cargas): qué características del vehículo (potencia, peso, consumo) dominan cada componente
  • Biplot: variables originales y vehículos proyectados en el mismo espacio 2D
  • Criterio de varianza acumulada para determinar el número óptimo de componentes

Interpretación y visualización

  • Proyección de vehículos a 2D: distinción visual entre tipos de vehículos (económicos vs. deportivos)
  • PC1 captura el eje potencia/peso; PC2 captura la relación consumo/aceleración
  • Detección de clusters naturales en el espacio reducido sin supervisión
  • PCA como preprocesamiento para reducir multicolinealidad antes de modelos supervisados

Más proyectos en ML No Supervisado