![imagenes](logo.png)

# Desviaciones

La idea de los rangos, tanto del usual como del intercuartílico, es medir la *dispersion global* de los datos. No obstante, recordemos que en lecciones previas aprendimos que uno de los objetivos de la Inferencia Estadística es seleccionar inteligentemente un representante de los datos.

Es por esto que podemos combinar ambas ideas y medir qué tanto se dispersan los datos respecto de un representante, y no solo globalmente. De esta manera, obtenemos dos nuevas métricas: la desviación típica (poblacional y muestral) y desviación media absoluta.

## Desviación típica

Se trata de la dispersión de los datos respecto de la media. Existen dos tipos: desviación típica poblacional y desviación típica muestral. 

La desviacion típica poblacional se define como $$\sigma=\sqrt{\frac{1}{N}\sum_{i=1}^N(x_i-\mu)^2}\mbox{ donde }N\mbox{ es el tamaño de la población y }\mu\mbox{ es el valor medio de la población}$$

En tanto que la desviación típica muestral se define como $$s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(x_i-\overline{x})^2}\mbox{ donde }n\mbox{ es el tamaño de la muestra y }\overline{x}\mbox{ es el valor medio de la muestra}$$

Una diferencia importante entre ambas es que, en general, recuerda que no conoceremos los parámetros poblacionales. En particular, no conoceremos la verdadera desviación poblacional de nuestra característica en la población de estudio. Por lo tanto, la desviación típica poblacional no se puede conocer y en la práctica trabajaremos con la desviación típica muestral.

Por cierto, que es importante notar que el denominador de esta última es $n-1$. Esto se hace para obtener un **estimador insesgado**. 







**Ejemplo.** Consideremos la siguiente muestra: 10,12,2,10,1,10,3. Por lo tanto $n=7$ y $\overline{x}=6.8571$

Entonces la varianza muestral es 
\begin{eqnarray*}
s^2&=&\frac{(10-6.8571)^2+(12-6.8571)^2+(2-6.8571)^2+(10-6.8571)^2+(1-6.8571)^2+(10-6.8571)^2+(3-6.8571)^2}{7-1}\\
&=&21.4761904761905
\end{eqnarray*}

Y por lo tanto la desviación típica muestral es $s=\sqrt{21.4761904761905}=4.63424108956261$

Por otra parte, consideremos la muestra 10,12,2025,10,1,10,3. Entonces $n=7$, $\overline{x}=295.86$ y la varianza muestral es 
\begin{eqnarray*}
s^2&=&\frac{(10-295.86)^2+(12-295.86)^2+(2025-295.86)^2+(10-295.86)^2+(1-295.86)^2+(10-295.86)^2+(3-295.86)^2}{7-1}\\
&=&581393.142857143
\end{eqnarray*}

y lo tanto la desviación típica muestral es $s=\sqrt{581393.142857143}=762.491405103784$


Como puede notarse, la desviación típica muestral es altamente sensible a la presencia de atípicos

## MAD: desviación absoluta mediana

Se trata de otra manera de medir la dispersión pero ahora con respecto a la mediana. Si $\boldsymbol{x}$ son los datos $x_1,x_2,...,x_n$ entonces
$$MAD=mediana(\{|x_1-mediana(\boldsymbol{x})|,|x_2-mediana(\boldsymbol{x})|,...,|x_n-mediana(\boldsymbol{x})|\})$$

Es decir, se calcula la mediana de los datos y luego la mediana de las distancias entre los datos y la mediana original.

**Ejemplo.** Consideremos la siguiente muestra: 10,12,2,10,1,10,3. Entonces $mediana(\boldsymbol{x})=10$.

Por lo tanto 
\begin{eqnarray*}
MAD&=&mediana(\{|10-10|,|12-10|,|2-10|,|10-10|,|1-10|,|10-10|,|3-10|\})\\
&=&mediana(\{0,2,8,0,9,0,7\})\\
&=&2
\end{eqnarray*}

Por otra parte, consideremos la muestra: 10,12,2025,10,1,10,3. Entonces $mediana(\boldsymbol{x})=10$.

Por lo tanto 
\begin{eqnarray*}
MAD&=&mediana(\{|10-10|,|12-10|,|2025-10|,|10-10|,|1-10|,|10-10|,|3-10|\})\\
&=&mediana(\{0,2,2015,0,9,0,7\})\\
&=&2
\end{eqnarray*}


Como puede verse, en caso de presencia de atípicos, la **MAD es mejor medida de dispersión respecto de la mediana que la desviación respecto de la media.** 

## Desviación típica vs MAD

Veamos ahora cómo implementar estas medidas de dispersión en diferentes lenguajes.

<pre style="color: teal; font-family: monospace; text-align: left;">
################################################################
#######################     En Excel     #######################
################################################################
</pre>

| Medida  | Código                                   |
|---------|-----------------------------------------|
| Desviación típica   | `=DESVEST.M(celda_inicial:celda_final)` |
| MAD | No hay función nativa|

<pre style="color: teal; font-family: monospace; text-align: left;">
################################################################
</pre>

```r
################################################################
########################      EN R       #######################
################################################################

datos = c(10,12,2,10,1,10,3)
datos_con_atipico = c(10,12,2025,10,1,10,3)

desviacion_datos = sd(datos,na.rm=TRUE)
desviacion_datos_con_atipico = sd(datos_con_atipico,na.rm=TRUE)

MAD_datos = mad(datos,na.rm=TRUE,constant=1)
MAD_datos_con_atipico = mad(datos_con_atipico,na.rm=TRUE,constant=1)

################################################################
```

```python
################################################################
########################    EN PYTHON    #######################
################################################################

import numpy as np
from scipy.stats import median_abs_deviation

datos = np.array([10, 12, 2, 10, 1, 10, 3])
datos_con_atipico = np.array([10, 12, 2025, 10, 1, 10, 3])

desviacion_datos = np.std(datos,ddof=1) 
desviacion_datos_con_atipico = np.std(datos_con_atipico,ddof=1)

MAD_datos = median_abs_deviation(datos) 
MAD_datos_con_atipico = median_abs_deviation(datos_con_atipico)

################################################################
```