🧠 Deep Learning
🧠 Deep Learning

Clasificador de imágenes con CNN

Clasificar imágenes en múltiples categorías es inviable con reglas manuales: el número de features relevantes (bordes, texturas, formas) escala con la resolución y varía por clase.

Problema

Clasificar imágenes en múltiples categorías es inviable con reglas manuales: el número de features relevantes (bordes, texturas, formas) escala con la resolución y varía por clase. Los modelos clásicos ML no capturan jerarquías espaciales.

Solución

Red neuronal convolucional (CNN) propia entrenada desde cero sobre un dataset de imágenes. Se complementa con transfer learning usando modelos preentrenados (VGG16, ResNet50) para comparar rendimiento con y sin conocimiento previo.

Arquitectura CNN

  • Capas convolucionales + ReLU + MaxPooling para extracción jerárquica de features
  • Capas fully connected al final para clasificación multiclase con softmax
  • Batch normalization entre capas para estabilizar y acelerar el entrenamiento
  • Dropout para regularización y reducción del sobreajuste

Transfer Learning

  • Fine-tuning de VGG16 y ResNet50 preentrenados en ImageNet
  • Congelado de capas base + entrenamiento de capas superiores
  • Comparativa: CNN desde cero vs. transfer learning — diferencia de accuracy y tiempo
  • Data augmentation: rotaciones, flips horizontales, zoom y normalización de píxeles

Evaluación

  • Matriz de confusión y classification report por clase
  • Curvas de aprendizaje: loss y accuracy en train vs. validation
  • Análisis de errores: imágenes que el modelo confunde y por qué
  • Grad-CAM para visualizar qué región de la imagen activa cada predicción

Más proyectos en Deep Learning