# Probabilidad Normal con Python

In [None]:
import scipy.stats as ss

En cuanto a nomenclatura de las funciones:

- cdf(x) - Función de distribución F(X)

- sf(x) = 1 - cdf(x)
 
- pmf(x) - Función de probabilidad f(x) (distribuciones discretas)
 
- pdf(x) - Función de densidad f(x) (distribuciones continuas)
 
- ppf(x) - Función inversa a cdf(x). Nos permite obtener el valor correspondiente a una probabilidad.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

### Ejercicio 1

La duración de un determinado componente electrónico, en horas, es una v.a. que se distribuye según una N(2000,40).

a)¿Cuál es la probabilidad de que la duración de una de esas componentes sea superior a 1900 horas? 

b)¿y de que esté entre 1850 y 1950 horas?

#### Solución

En primer lugar voy a representar la variable:

In [None]:
X = ss.norm(2000,40)
x = np.arange(X.ppf(0.01),X.ppf(0.99))
plt.plot(x,X.pdf(x),"r")
plt.show()

In [None]:
# Que el resultado de X.ppf(0.01) sea 1906.94608504 significa que: con probabilidad 0.01 X vale menos que 1906.94608504
# Que el resultado de X.ppf(0.99) sea 2092.94608504 significa que: con probabilidad 0.99 X vale menos que 2092.94608504

Apartado a)


In [None]:
X.sf(1900) # 0.99379033467422384

Apartado b)

In [None]:
X.cdf(1950) - X.cdf(1850) # 0.10556135638165455

### Ejercicio 2

La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación típica 3 kg.

Suponiendo que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan:

1 Entre 60 kg y 75 kg.

2 Más de 90 kg.

3 Menos de 64 kg.

$\color{red}{\text{4 64 kg.}}$


#### Solución

In [None]:
# Genero mi vble
X = ss.norm(70,3)

1) P[60<= X <= 75] = P[X<= 75] - P[X <= 60]

In [None]:
prob = X.cdf(75) - X.cdf(60)
prob

In [None]:
prob*500

2) P[X>90] = 1-P[X<=90]

In [None]:
prob2 = X.sf(90)
prob2

In [None]:
prob2*500

3) P[X<=64]

In [None]:
prob3 = X.cdf(64)
prob3

In [None]:
prob3*500

$\color{red}{\text{4) 64kg}}$

Cuando la distribución es continua, la probabilidad de que la variable tenga un valor exacto siempre es nula (0). 
<br>Por lo tanto: P(X = 64) = 0.

### $\color{red}{\text{Ejercicio 3}}$

En unos estudios realizados a un determinado tipo de aves rapaces, se comprueba que la longitud de las alas extendidas, X,
es una variable aleatoria que se distribuye aproximadamente según una curva Normal, de media 110 cm. y desviación típica 4 cm.
Elegida un ave al azar y suponiendo que las longitudes se distribuyen normalmente, calcular:

a) La probabilidad de que la longitud de las alas esté comprendida entre 110 y 115 cm.

b) La probabilidad de que la longitud de las alas sea mayor que 105 cm.

c) La probabilidad de que la longitud de las alas sea menor de 100 cm.

d) La longitud mínima  del 20% de las alas que más miden.

e) Quince longitudes aleatorias que sigan dicha distribución.

$\color{red}{\text{Sol.}}$

En primer lugar vamos a definir la v.a. X, que por el enunciado sabemos que X~N(110,4):

In [None]:
X = ss.norm(110,4)

Apartado a)

Buscamos P[110 <= X <= 115] = P[X <= 115] - P[X <= 110] = F(115) - F(110)

In [None]:
prob = X.cdf(115) - X.cdf(110)
prob

Apartado b)

Buscamos P[X > 105] = 1 - P[X <= 105] = 1- F(105)

In [None]:
prob2 = X.sf(105)
prob2

Apartado c)

Buscamos P[X < 100] =  F(100)

In [None]:
prob3 =X.cdf(100)
prob3

Apartado d)

Es decir, buscamos la longitud del valor que se encuentra en el percentil 80, que es el que deja a su derecha al 20% de las observaciones.

In [None]:
valor4 = X.ppf(0.8)
valor4

Apartado e)

In [None]:
Para ello vamos a generar estas 15 longitudes aleatorias usando la función 

In [None]:
Y = np.random.normal(110,4,15)

In [None]:
Y

* Nota: Debemos tener en cuenta que dado el carácter aleatorio de los valores generados en este apartado , dichos valores pueden no coincidir con los que se obtengan a través de otra llamada a la misma función.