# Inferencia Estadistica con la Distribucion Normal

## Intervalo de Confianza

**Es un par de numeros entre los cuales se estima que estara cierto valor desconocido respecto de un parametro poblacional**. Para una variable que sigue una distribucion normal estandar, el intervalo de confianza son dos valores simetricos, respecto a la media $(\mu = 0)$, que encierran un porcentaje que se requiere conocer.

![image.png](attachment:image.png)

- Al porcentaje que hay entre los dos valores antes mencionados, se conoce como **Nivel de Confianza**.

- Al area que queda por fuera del nivel de confianza se conoce como **Nivel de Significacion** ($\alpha$). La probabilidad de quedar fuera del intervalo o $\alpha$ se distribuye de la siguiente forma: La mitad es por que se han pasado del rango $\alpha/2$ y la otra mitad es que no le ha alcanzado $\alpha/2$.

- Los numero que limitan el intervalo de confianza se conocen como $Z_{\alpha/2}$

![image-2.png](attachment:image-2.png)

Veamos algunos ejemplos para entender mejor este concepto

## *Ejemplo 1: En una distribucion normal estandar $N(0,1)$. Calcular:*

### a.- El intervalo de confianza  del 95%

Lo que nos piden calcular es el 95% de confianza respecto a la media de la distribucion, tal como se muestra,

![image.png](attachment:image.png)

Entonces, el area que queda por fuera es del 5%, que es el valor de $\alpha$ que se puede calcular con la siguiente formula:

$$\alpha = 1 - NC$$

La distribucion de $\alpha$ es 2.5% por arriba y 2.5% por debajo.

![image-2.png](attachment:image-2.png)

Para calcular el valor de $Z_{\alpha/2}$ por arriba, debemos agregar el area de $\alpha$ al nivel de confianza, es decir

$$Z_{\alpha/2} = NC + \alpha/2 = 0.95 + 0.025 = 0.975$$

![image-3.png](attachment:image-3.png)

Ahora podemos, facilmente ubicar en la tabla $Z$ o mediante la libreria Scipy el valor de $Z$ correspondiente a dicha area. Veamos como hacerlo

In [1]:
# Parametros de la distribucion

# media
media = 0

# desviacion tipica
std = 1

In [5]:
# importar libreria
from scipy.stats import norm

# Calculo del valor correspondiente a la probabilidad 0.975
num_Z = norm.ppf(0.975, media, std)
num_Z = num_Z.round(2)
num_Z

1.96

El valor de $Z_{\alpha/2}$ por arriba es de 1.96. Por simetria el valor de $-Z_{\alpha/2}$ es de -1.96. Podemos expresar el intervalo de confianza calculado, como sigue:

$$IC_{95} = (-1.96; 1.96)$$

### b.- El intervalo de confianza del 90%

El area que queda por fuera es del 10%, es decir

$$NC = 0.90$$

$$\alpha = 1 - NC = 1 - 0.90 = 0.10$$

Entonces, para calcular $Z_{\alpha/2}$ debemos sumar al nivel de confianza la mitad del area de $\alpha$

$$Z_{\alpha/2} = NC + \alpha/2 = 0.90 + 0.05 = 0.95$$

![image.png](attachment:image.png)

Calculemos el valor de $Z$ que corresponde a la probabilidad de 0.95 con Scipy

In [8]:
# calculo de Z correspondiente a la probabilidad de 0.95
num_z = norm.ppf(0.95, media, std)
num_z = num_z.round(3)
num_z

1.645

El valor de $Z_{\alpha/2}$ es de 1.645. Por simetria el valor de $-Z_{\alpha/2}$ es de -1.645. Podemos expresar el intervalo de confianza calculado, como sigue:

$$IC_{90} = (-1.645; 1.645)$$

## *Ejemplo 2: La duracion en kilometros de los neumaticos de una cierta marca se ajusta a una distribucion $N(48000, 3000)$. Calcular el intervalo de confianza del 80%*

Nos piden entre que dos valores de kilometraje el 80% de los neumaticos resisten.

![image.png](attachment:image.png)

El area que queda por fuera es del 20%, es decir

$$NC = 0.80$$

$$\alpha = 1 - NC = 1 - 0.80 = 0.20$$

Entonces, para calcular el $Z_{\alpha/2}$ debemos sumar al nivel de confianza la mitad del area de $\alpha$ 

$$Z_{\alpha/2} = NC + \alpha/2 = 0.80 + 0.10 = 0.90$$

El valor de Z podemos calcularlo mediante la tabla $Z$ tipificando la variable. Tambien se puede utilizar el metodo de probabilidad acumulada de la distribucion normal (ppf) directamente. Pero hay una forma mas directa de calcular el intervalo de confianza de una distribucion normal especifica para un nivel de confianza dado y es mediante el metodo $interval$. Veamos como aplicarlo:

In [9]:
# parametros de la distribucion

# media
media = 48000
# desviacion tipica
std = 3000

In [11]:
# intervalo de confianza para un nivel del 0.80
IC = norm.interval(0.80, media, std)
IC

(44155.3453033662, 51844.6546966338)

Notamos que este metodo no requiere adicionar al nivel de confianza la mitad de $\alpha$, solo requiere el nivel de confianza deseado (NC), la media ($\mu$) y la desviacion tipica ($\sigma$) de la variable, por lo que ahorramos algunos pasos de razonamiento y codigo.

El intervalo de confianza es el siguiente:

$$IC_{80} = (44155, 51844)$$

Esta marca puede asegurar que el 80% de sus neumaticos duran entre 44155 y 51844 kilometros