Comparar múltiples algoritmos de regresión sobre más de 1 millón de registros de viajes de taxi en Nueva York sin perder el rastro de experimentos, hiperparámetros y métricas.
Comparar múltiples algoritmos de regresión sobre más de 1 millón de registros de viajes de taxi en Nueva York sin perder el rastro de experimentos, hiperparámetros y métricas. Sin tracking sistemático, la reproducibilidad es imposible y la selección del mejor modelo se vuelve arbitraria.
MLflow como plataforma de tracking: comparativa de 5 algoritmos de regresión (Linear Regression, Lasso, Ridge, Random Forest, XGBoost) sobre el dataset de NYC taxis, con registro automático de todos los parámetros y métricas. El mejor modelo (XGBoost: RMSE 0.74, R² 0.98) se registra en MLflow Model Registry.