# Todo sobre la Distribución Normal

Es una distribución icónica en la estadística que se presenta en muchos fenómenos naturales y procesos aleatorios como encuestas. El término Normal indica que es una de las más frecuentes y útiles en la estadística, no que sea la única o la más correcta.

Veamos un ejemplo para ir comprendiendo de qué se trata

### *Tenemos un grupo de personas de una ciudad y queremos estudiar la distribución de la altura y la media de toda la población*

Vamos midiendo cada persona y los resultados los vamos organizando en un histograma

![image.png](attachment:image.png)

La grafica anterior se ajusta a una curva de distribución normal

![image-2.png](attachment:image-2.png)

Esta curva tiene algunas características importantes:

> - La altura media es también la más frecuente. La media es igual a la moda.
> - La distribución es simétrica respecto a la media. Hay tanta gente que mide mas de la media, como gente que mide menos de la media.
> - Muchas encuestas o parámetros a estudiar se ajustan a esta curva
> - La media poblacional se representa por $\mu$
> - La desviación típica, que se representa por $\sigma$, es una medida de qué tan cerca o lejos están los datos de la media $\mu$. Para una población heterogénea, $\sigma$ es muy alta; para una población homogénea, $\sigma$ es muy baja

## Función de Distribución Normal

Carl Friedrich Gauss, se propuso a encontrar una función matemática que se ajuste a la curva de la distribución normal y dedujo la siguiente fórmula:

$$f(x) = \frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x - \mu}{\sigma} \right )^{2}}$$

Las características de esta función son las siguientes:
- Considera la media ($\mu$) y la desviación típica ($\sigma$).
- Es simétrica respecto a la media, al igual que la distribución.
- Tiene una asíntota horizontal que es el eje x.
- El área entre la función y el eje horizontal es igual a 1. Recordemos que para calcular áreas bajo una curva, en matemáticas, utlizamos integrales:

$$Area = \int_{-\infty}^{\infty}\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x - \mu}{\sigma} \right )^{2}} dx = 1$$

Al valer toda el área 1, podemos extrapolar a que es el 100% de la población ya que toda la población esta englobada bajo esa función.

Veamos un ejemplo

### *Supongamos que en un determinado país la estatura de la población adultas sigue una distribución normal de media 170 cm y desviación típica igual a 12 cm*

La distribución normal, para el ejemplo, se representa de la siguiente forma:

$$N(\mu, \sigma)\rightarrow N(170, 12)$$

La función, para los valores de $\mu$ y $\sigma$ dados se representa como sigue:

$$ f(x)= \frac{1}{12 \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x - 170}{12} \right )^{2}}$$

Si evaluamos la función para un rango contínuo entre 130 y 210 obtenemos la siguiente distribución:

![image-2.png](attachment:image-2.png)

Claramente vemos que en el centro esta el valor de 170, como indicaba la media dada y vemos como a medida que nos acercamos a estaturas extremas como 130 cm y 210 cm, el porcentaje de la población es cada vez mas pequeño.

### *Que porcentaje de esa población mide más de 170 cm?*

Este porcentaje de la población viene representado por lo que estan a la derecha de 170 que es la media

![image.png](attachment:image.png)

Entonces, para caclularlo debemos integrar la funcion desde 170 hasta infinito como sigue:

$$Poblacion(X > 170 ) = \int_{170}^{\infty}\frac{1}{12 \sqrt{2\pi}}e^{-\frac{1}{2}\left ( \frac{x - 170}{12} \right )^{2}} dx$$

Vamos a calcular la integral con la libreria Sympy de Python

In [18]:
# libreria para calculo de integrales
import sympy as sp

# definimos la funcion
f = (1/(12*sp.sqrt(2*sp.pi)))*sp.exp(-0.5*((x-170)/12)**2)

# calculo de la integral
result_integral = sp.integrate(f,(x, 170, sp.oo))

# mostrar resultado
result_integral

0.353553390593274*sqrt(2)

In [23]:
# difnimos la libreria numpy
import numpy as np

# multiplicamos el numero decimal por la raiz cuadrada de 2
result = 0.35355339*np.sqrt(2)
result = result.round(2)
result

0.5

> El 50% de la poblacion mide mas de 170 cm

### *Que porcentaje de  esa poblacion mide menos de 180 cm?*

En este caso, el porcentaje viene dado por el area que va desde menos infinito hasta 180. 

![image.png](attachment:image.png)

calculemos la integral con Python

In [24]:
# definimos la funcion
f = (1/(12*sp.sqrt(2*sp.pi)))*sp.exp(-0.5*((x-170)/12)**2)

# calculo de la integral
result_integral = sp.integrate(f,(x, -sp.oo, 180))

# mostrar resultado
result_integral

0.56403901098066*sqrt(2)

In [26]:
# multiplicamos el numero decimal por la raiz cuadrada de 2
result = 0.564039*np.sqrt(2)
result = result.round(3)
result

0.798

> El 79% de la poblacion mide menos de 180 cm

### *Que porcentaje de esa poblacion mide entre 165 y 190 cm?*

El porcentaje viene dado por el calculo del area en el rango entre 165 y 190 cm

![image.png](attachment:image.png)

Calculemos dicha integral

In [27]:
# definimos la funcion
f = (1/(12*sp.sqrt(2*sp.pi)))*sp.exp(-0.5*((x-170)/12)**2)

# calculo de la integral
result_integral = sp.integrate(f,(x, 165, 190))

# mostrar resultado
result_integral

0.433985746245147*sqrt(2)

In [28]:
# multiplicamos el numero decimal por la raiz cuadrada de 2
result = 0.4339857*np.sqrt(2)
result = result.round(3)
result

0.614

> El porcentaje de la poblacion que mide entre 165 y 190 cm es de 61.4%