🔧 Preprocesamiento de Datos
🔧 Preprocesamiento de Datos

Feature engineering y data augmentation

Dos problemas de clasificación con características de datos distintas: predicción de catástrofes en naves espaciales (tabular, con features que necesitan ingeniería) y detección de transmisiones enemigas (imágenes, con dataset desbalanceado).

Problema

Dos problemas de clasificación con características de datos distintas: predicción de catástrofes en naves espaciales (tabular, con features que necesitan ingeniería) y detección de transmisiones enemigas (imágenes, con dataset desbalanceado). Cada uno requiere estrategias diferentes de feature engineering y augmentation.

Solución

Feature engineering avanzado para el problema tabular (creación de nuevas variables, codificación) + SMOTE/ADASYN para el desbalanceo de clases + data augmentation de imágenes con OpenCV/PIL para el problema visual. Un notebook que cubre el ciclo completo de preprocesamiento para ambos tipos de datos.

Feature engineering tabular

  • Creación de nuevas variables a partir de features existentes del dataset de naves espaciales
  • Codificación de categóricas y transformaciones de variables numéricas
  • StandardScaler y OneHotEncoder integrados en pipeline de scikit-learn
  • Evaluación del impacto de los nuevos features en modelos de clasificación

Balanceo de clases y augmentation de imágenes

  • SMOTE: oversampling sintético interpolando entre vecinos de la clase minoritaria
  • RandomUnderSampler y SMOTEENN: estrategias combinadas de over + undersampling
  • Data augmentation de imágenes con OpenCV: rotación, brillo, contraste, filtros
  • PIL para transformaciones adicionales: escala de grises, detección de bordes, extracción de features

Más proyectos en Preprocesamiento de Datos