📈 Estadística para DS
📈 Estadística para DS

Análisis de correlaciones y dependencias

La correlación de Pearson solo detecta relaciones lineales y es sensible a outliers.

Problema

La correlación de Pearson solo detecta relaciones lineales y es sensible a outliers. Usar Pearson ciegamente puede esconder relaciones monótonas no lineales o llevar a concluir que dos variables son independientes cuando no lo son.

Solución

Análisis completo de dependencias: Pearson para relaciones lineales, Spearman para monótonas, Kendall para datos ordinales, tests de independencia chi-cuadrado para categóricas y detección de relaciones espurias mediante análisis de causalidad con variables de control.

Tipos de correlación

  • Pearson: relación lineal entre dos variables continuas — supone normalidad
  • Spearman: correlación de rangos — robusto ante outliers y relaciones monótonas
  • Kendall tau: concordancia de pares — preferible con n pequeño o datos ordinales
  • Point-biserial: correlación entre una continua y una binaria

Tests de independencia y causalidad

  • Chi-cuadrado de independencia para dos variables categóricas
  • Test de correlación de Pearson: H₀: ρ = 0 con p-valor y IC 95%
  • Correlaciones espurias: control por tercera variable con correlación parcial
  • Correlación vs. causalidad: ejemplos de correlaciones espurias y cómo identificarlas

Más proyectos en Estadística para DS