Estadística bidimensional

Tablas de doble entrada

 \begin{tabular}{c||c|c|c|c|c||c}
X \backslash Y & y_1 & y_2 & y_3 & y_4 & ... & Total \\
\hline
x_1 & f_{11} & f_{12}  &  &  &  & \\
\hline
x_2 &  &  &  &  &  & \\
\hline
x_3 &  &  &  &  &  & \\
\hline
x_4 &  &  &  &  &  & \\
\hline
... &  &  &  &  & f_{ij} & \\
\hline
Total &  &  &  &  &  & N\\
\end{tabular}

Cálculo de Parámetros

Medias marginales

\overline{x} = \frac{\sum x_i \cdot f_i}{N}
\qquad \qquad
\overline{y} = \frac{\sum y_j \cdot f_j}{N}

Varianzas marginales

s_x^2=\frac{\sum x_i^2 \cdot f_i}{N}-\overline{x}^2
\qquad
s_y^2=\frac{\sum y_j^2 \cdot f_j}{N}-\overline{y}^2

Desviaciones típicas marginales

\sigma_x=+\sqrt{s_x^2}
\qquad \qquad \qquad
\sigma_y=+\sqrt{s_y^2}

Diagrama de dispersión o nube de puntos

Covarianza

\sigma_{xy} = \frac{\sum x_i \cdot y_j \cdot f_{ij}}{N} - \overline{x} \cdot \overline{y}

- Covarianza positiva: La nube de puntos se orienta hacia la derecha. Al aumentar los valores de X, también aumentan los de Y.

- Covarianza negativa: La nube de puntos se orienta hacia la izquierda. Al aumentar los valores de X, disminuyen los de Y.

Correlación

Es la relación que existe entre ambas variables.

- Correlación funcional: cuando existe una relación funcional entre ambas variables. Todos los puntos de la nube está situados sobre una recta o una curva.
- Correlación directa: si al aumentar una variable, aumenta la otra.
- Correlación inversa: si al aumentar una variable, disminuye la otra.
- Correlación nula: cuando no existe ninguna relación entre las variables.

Coeficiente de correlación de Pearson

r = \frac{\sigma_{xy}}{\sigma_x \cdot \sigma_y}

- Si r=\pm 1, correlación funcional (perfecta)
- Si r está cercano a \pm 1, correlación fuerte
- Si r está cercano a 0, correlación débil

Rectas de regresión

Son las rectas que mejor se ajustan a la nube de puntos.

Recta de regresión de Y sobre X

y=\overline{y}+\frac{\sigma_{xy}}{\sigma_x^2}\cdot (x-\overline{x})

Se usa para obtener una aproximación de los valores de Y, a partir de los valores de X

Recta de regresión de X sobre Y

x=\overline{x}+\frac{\sigma_{xy}}{\sigma_y^2}\cdot (y-\overline{y})

Se usa para obtener una aproximación de los valores de X, a partir de los valores de Y