Lab
📈 6 proyectos

Estadística para DS

Estadística aplicada a datos reales: distribuciones, regresión, correlación e inferencia sobre datasets únicos.

Problema

Los modelos ML sin fundamentos estadísticos son cajas negras frágiles. Entender la distribución de los datos, construir intervalos de confianza con bootstrap, validar supuestos de regresión o analizar relaciones bivariadas entre variables de datasets reales es la diferencia entre ciencia de datos y ajuste de curvas a ciegas.

Solución

Estadística descriptiva sobre datos reales (tweets, mercado bursátil, aceitunas, PISA, Fortnite). Pruebas de normalidad (Shapiro-Wilk, Kolmogorov-Smirnov) y construcción de intervalos de confianza con bootstrap. Análisis bivariado con correlaciones y tests de asociación. Regresión lineal múltiple con OLS, diagnóstico de supuestos y métricas RMSE/R².

Más áreas