👁️ Computer Vision
👁️ Computer Vision

OCR de matrículas

Leer automáticamente el texto en una matrícula de vehículo a partir de una foto implica varios subproblemas: localizar la matrícula en la imagen, corregir la perspectiva, mejorar el contraste y luego reconocer los caracteres — que pueden estar inclinados, sucios o en condiciones de iluminación adversas.

Problema

Leer automáticamente el texto en una matrícula de vehículo a partir de una foto implica varios subproblemas: localizar la matrícula en la imagen, corregir la perspectiva, mejorar el contraste y luego reconocer los caracteres — que pueden estar inclinados, sucios o en condiciones de iluminación adversas.

Solución

Pipeline de cuatro etapas: detección de la zona de matrícula, corrección de perspectiva con transformación homográfica, preprocesamiento morfológico (binarización adaptativa, apertura/cierre) y reconocimiento de caracteres con Tesseract OCR más post-procesamiento con regex.

Localización y corrección

  • Detección de la región de matrícula con contornos (OpenCV) o YOLO fine-tuned
  • Extracción de los 4 vértices de la matrícula y cálculo de la transformación de perspectiva
  • Warping a imagen rectificada de tamaño fijo para normalizar la entrada al OCR

Preprocesamiento y OCR

  • Conversión a escala de grises → binarización adaptativa (Otsu o adaptativa por bloque)
  • Operaciones morfológicas: erosión y dilatación para limpiar ruido y separar caracteres
  • Tesseract con configuración page_seg_mode=7 (línea de texto única)
  • Post-procesamiento: regex para filtrar y corregir el formato esperado de matrícula
  • Evaluación: accuracy por carácter y por placa completa sobre set de validación

Más proyectos en Computer Vision