Un dataset de vehículos con múltiples características técnicas (cilindrada, potencia, peso, consumo, aceleración) tiene alta correlación entre variables: la redundancia dificulta la visualización y puede inflar la importancia de features correlacionadas.
Un dataset de vehículos con múltiples características técnicas (cilindrada, potencia, peso, consumo, aceleración) tiene alta correlación entre variables: la redundancia dificulta la visualización y puede inflar la importancia de features correlacionadas. Se necesita reducir la dimensionalidad preservando la información.
PCA (Principal Component Analysis) para encontrar las componentes de máxima varianza en los datos de vehículos y proyectarlos a un espacio reducido. Biplot para visualizar qué características contribuyen a cada componente e identificar tipos de vehículos en el espacio reducido.