👁️ Computer Vision

OCR de matrículas

Leer automáticamente el texto en una matrícula de vehículo a partir de una foto implica varios subproblemas: localizar la matrícula en la imagen, corregir la perspectiva, mejorar el contraste y luego reconocer los caracteres — que pueden estar inclinados, sucios o en condiciones de iluminación adversas.

Problema

Solución

Pipeline de cuatro etapas: detección de la zona de matrícula, corrección de perspectiva con transformación homográfica, preprocesamiento morfológico (binarización adaptativa, apertura/cierre) y reconocimiento de caracteres con Tesseract OCR más post-procesamiento con regex.

Localización y corrección

Detección de la región de matrícula con contornos (OpenCV) o YOLO fine-tuned
Extracción de los 4 vértices de la matrícula y cálculo de la transformación de perspectiva
Warping a imagen rectificada de tamaño fijo para normalizar la entrada al OCR

Preprocesamiento y OCR

Conversión a escala de grises → binarización adaptativa (Otsu o adaptativa por bloque)
Operaciones morfológicas: erosión y dilatación para limpiar ruido y separar caracteres
Tesseract con configuración page_seg_mode=7 (línea de texto única)
Post-procesamiento: regex para filtrar y corregir el formato esperado de matrícula
Evaluación: accuracy por carácter y por placa completa sobre set de validación

OCR de matrículas

Problema

Solución

Localización y corrección

Preprocesamiento y OCR

Detección y conteo de objetos en vídeo

Mejora de imágenes nocturnas