Clasificador de imágenes con CNN

Problema

Clasificar imágenes en múltiples categorías es inviable con reglas manuales: el número de features relevantes (bordes, texturas, formas) escala con la resolución y varía por clase. Los modelos clásicos ML no capturan jerarquías espaciales.

Solución

Red neuronal convolucional (CNN) propia entrenada desde cero sobre un dataset de imágenes. Se complementa con transfer learning usando modelos preentrenados (VGG16, ResNet50) para comparar rendimiento con y sin conocimiento previo.

Arquitectura CNN

Capas convolucionales + ReLU + MaxPooling para extracción jerárquica de features
Capas fully connected al final para clasificación multiclase con softmax
Batch normalization entre capas para estabilizar y acelerar el entrenamiento
Dropout para regularización y reducción del sobreajuste

Transfer Learning

Fine-tuning de VGG16 y ResNet50 preentrenados en ImageNet
Congelado de capas base + entrenamiento de capas superiores
Comparativa: CNN desde cero vs. transfer learning — diferencia de accuracy y tiempo
Data augmentation: rotaciones, flips horizontales, zoom y normalización de píxeles

Evaluación

Matriz de confusión y classification report por clase
Curvas de aprendizaje: loss y accuracy en train vs. validation
Análisis de errores: imágenes que el modelo confunde y por qué
Grad-CAM para visualizar qué región de la imagen activa cada predicción

Problema

Solución

Arquitectura CNN

Transfer Learning

Evaluación

Análisis de sentimiento en reseñas con LSTM

Redes neuronales DNN: XOR y Fashion MNIST