# **Exposición de premios de Alura**

Supongamos que acabamos de crear un juego de lotería llamado Exposición de Premios de Alura. En este nuevo juego, el que apuesta marca 20 números, de los 25 disponibles en el boleto, y puede ganar hasta 1 millón de pesos.

Determine el número de combinaciones posibles (espacio muestral) y la probabilidad de ganar el premio jugando solo un boleto (considere sólo quince lugares decimales).

In [1]:
from scipy.special import comb

In [2]:
combinaciones = comb(25, 20)
combinaciones

np.float64(53130.0)

In [3]:
probabilidad = 1 / combinaciones
print(f"La probabilidad de ganar es de {probabilidad:.15f}")

La probabilidad de ganar es de 0.000018821757952


# **Lanzamiento de monedas**

Una moneda **perfectamente equilibrada** se lanza al aire **cuatro veces**. Usando la **distribución binomial**, obtenga la probabilidad de que la moneda caiga con la **cruz** hacia arriba **dos veces**.

In [4]:
from scipy.stats import binom

## $$P(k)=\binom{n}{k} p^k q^{n-k}$$

Donde:

$p$ = probabilidad de éxito

$q = (1 - p)$ = probabilidad de fracaso

$n$ = número de eventos estudiados

$k$ = número de eventos deseados que tienen éxito

In [5]:
# Total de lanzamientos
n = 4

In [6]:
# Probabilidad de salir CRUZ
p = 1 / 2
p

0.5

In [7]:
# Probabilidads de fracaso (CRUZ hacia abajo)
q = 1 - p
q

0.5

In [8]:
# Total de aciertos (CRUZ hacia arriba)
k = 2
k

2

In [9]:
# opción 1
probabilidad = binom.pmf(k, n, p)
probabilidad

np.float64(0.375)

In [10]:
# opción 2
probabilidad = comb(n, k) * (p ** k) * (q ** (n - k))
probabilidad

np.float64(0.375)

# **Lanzamiento de dados**

Un dado **perfectamente equilibrado** se lanza hacia arriba **diez veces**. Usando la **distribución binomial**, obtenga la probabilidad de que los dados caigan con el número **cinco** hacia arriba **al menos tres veces**.

In [11]:
n = 10

In [12]:
p = 1 / 6

In [13]:
q = 1 - p

In [14]:
k = 3

In [15]:
probabilidad = binom.sf(k, n, p)
print(f'{probabilidad:.2%}')

6.97%


# **Posibilidad de tener ojos azules**

Suponga que la probabilidad de que una pareja tenga hijos con ojos azules es del `22%`. En 50 familias, con 3 hijos cada una, ¿cuántas podemos esperar que tengan dos hijos con ojos azules?

In [16]:
p = 0.22

In [17]:
n = 3

In [18]:
k = 2

In [19]:
N = 50

In [20]:
probabilidad = binom.pmf(k, n, p) * N
print(f'{probabilidad}')

5.662799999999996


# **Estimando los clientes en determinada hora**

El **número media de clientes** que ingresan a una panadería por hora es 20. Obtenga la **probabilidad** de que, en la próxima hora, ingresen **exactamente 25 clientes**.

## $$P(k) = \frac{e^{-\mu}(\mu)^k}{k!}$$

Donde:

$e$ = constante cuyo valor aproximado es 2.718281828459045

$\mu$ = representa el número promedio de ocurrencias en un intervalo de tiempo o espacio dado

$k$ = número de éxitos en el intervalo deseado

In [21]:
import numpy as np
from scipy.stats import poisson
import math

In [22]:
media_clientes = 20
u = media_clientes

In [23]:
ocurrencias_esperadas = 25
k = ocurrencias_esperadas

In [24]:
# opción 1 - POISSON
probabilidad = poisson.pmf(k, u)
print(f'{probabilidad:.2%}')

4.46%


In [25]:
# opción 2 - MATH
probabilidad = (math.exp(-u) * (u ** k)) / math.factorial(k)
print(f'{probabilidad:.2%}')

4.46%


In [26]:
# opción 3 - NUMPY
probabilidad = (np.exp(-u) * (u ** k)) / math.factorial(k)
print(f'{probabilidad:.2%}')

4.46%


# **Prueba de Estadística**

La aplicación de una prueba Estadística en una competencia presentó un conjunto de notas normalmente distribuidas. Se encontró que el conjunto de notas **tenía una media de 70** y una **desviación estándar de 5 puntos**.

¿Qué probabilidad hay de que un estudiante, seleccionado al azar, **obtenga una puntuación inferior a 85 puntos**?

## $$Z = \frac{x-\mu}{\sigma}$$

Donde:

$x$ = variable normal con media $\mu$ y desviación estándar $\sigma$

$\sigma$ = desviación estándar

$\mu$ = media

In [27]:
media = 70

In [28]:
desviacion_estandar = 5

In [29]:
z = (85 - media) / desviacion_estandar
z

3.0

In [30]:
from scipy.stats import norm

In [31]:
probabilidad = norm.cdf(z)
print(f'{probabilidad:.2%}')

99.87%


In [32]:
# opción 2
probabilidad = norm.cdf(85, media, desviacion_estandar)
print(f'{probabilidad:.2%}')

99.87%


# **Facturación diaria**

La facturación diaria de un controlador de aplicación sigue una distribución aproximadamente normal, con un media de `$ 300,00` y una desviación estándar igual a `$ 50,00`. Obtenga las probabilidades de que, en un día aleatorio, el conductor gane:

1) Entre `$ 250,00` y `$ 350,00`

2) Entre `$ 400,00` y `$ 500,00`

## **1):**

In [33]:
from scipy.stats import norm

In [34]:
media = 300

In [35]:
desviacion_estandar = 50

In [36]:
Z_superior = (350 - media) / desviacion_estandar
Z_superior

1.0

In [37]:
Z_inferior = (250 - media) / desviacion_estandar
Z_inferior

-1.0

In [38]:
probabilidad = norm.cdf(Z_superior) - norm.cdf(Z_inferior)
print(f'{probabilidad:.2%}')

68.27%


## **2):**

In [39]:
Z_inferior = (400 - media) / desviacion_estandar

In [40]:
Z_superior = (500 - media) / desviacion_estandar

In [41]:
probabilidad = norm.cdf(Z_superior) - norm.cdf(Z_inferior)
print(f'{probabilidad:.2%}')

2.27%


# **Vida útil**

Una empresa verificó que las lámparas incandescentes XPTO tienen una vida útil normalmente distribuida, con un media igual a 720 días y una desviación estándar igual a 30 días. Calcula la probabilidad de que una lámpara, elegida al azar, dure:

1) Entre 650 y 750 días

2) Más de 800 días

3) Menos de 700 días

# **Item 1:**

In [42]:
media = 720

In [43]:
desviacion_estandar = 30

In [44]:
Z_inferior = (650 - media) / desviacion_estandar
Z_inferior

-2.3333333333333335

In [45]:
Z_superior = (750 - media) / desviacion_estandar
Z_superior

1.0

In [46]:
probabilidad = norm.cdf(Z_superior) - norm.cdf(Z_inferior)
print(f'{probabilidad:.2%}')

83.15%


## **Item 2:**

In [47]:
Z = (800 - media) / desviacion_estandar
Z

2.6666666666666665

In [48]:
probabilidad = 1 - norm.cdf(Z)
print(f'{probabilidad:.2%}')

0.38%


## **Item 3:**

In [49]:
Z = (700 - media) / desviacion_estandar
Z

-0.6666666666666666

In [50]:
probabilidad = norm.cdf(Z)
print(f'{probabilidad:.2%}')

25.25%


# **Calculando probabilidades**

Usando la tabla estandarizada, o las herramientas proporcionadas por Python, encuentre el área debajo de la curva normal para los valores `Z` a continuación:

1) Z < 1,96

2) Z > 2,15

3) Z < -0,78

4) Z > 0,59

## **Item 1:**

In [51]:
Z = 1.96

In [52]:
probabilidad = norm.cdf(Z)
print(f'{probabilidad:.2%}')

97.50%


## **Item 2:**

In [53]:
Z = 2.15

In [54]:
probabilidad = 1 - norm.cdf(Z)
# o -> probabilidad = norm.sf(2.15)
print(f'{probabilidad:.2%}')

1.58%


## **Item 3:**

In [55]:
Z = -0.78

In [56]:
probabilidad = norm.cdf(Z)
print(f'{probabilidad:.2%}')

21.77%


## **Item 4:**

In [57]:
Z = 0.59

In [58]:
probabilidad = 1 - norm.cdf(Z)
# o -> probabilidad = norm.sf(0.59)
print(f'{probabilidad:.2%}')

27.76%


# **Margen de error**

Para estimar la cantidad media gastada por cada cliente de una gran cadena de comida rápida, se seleccionó una muestra de 50 clientes.

Suponiendo que el valor de la desviación estándar de la población es de `$ 6,00` y que esta población se distribuye normalmente, obtenga el margen de error de esta estimación para un nivel de confianza del `95%`.

>El error inferencial se define por la desviación estándar de las medias muestrales  σx¯  y por el nivel de confianza determinado para el proceso.   

## $$e = z \frac{\sigma}{\sqrt{n}}$$

In [59]:
n = 50

In [60]:
desviacion_estandar = 6

In [62]:
raiz_de_n = np.sqrt(n)
raiz_de_n

np.float64(7.0710678118654755)

In [63]:
sigma = desviacion_estandar / raiz_de_n
sigma

np.float64(0.848528137423857)

In [68]:
e = sigma * norm.ppf(0.975)
e

np.float64(1.6630845892196133)

In [70]:
# otra forma de calcular
from scipy.stats import norm
import numpy as np

z = norm.ppf(0.975)
desviacion_estandar = 6
n = 50

e = z * (desviacion_estandar / np.sqrt(n))
print(f"$ {e:0.2f}")

$ 1.66


# **Intervalo de confianza**

Una muestra aleatoria simple de 1976 elementos de una población distribuida normalmente, con una desviación estándar de 11, dio como resultado una media muestral de 28.

¿Cuál es el intervalo de confianza del 90% para la media de la población?

In [71]:
n = 1976

In [72]:
media_muetral = 28

In [73]:
desviacion_std = 11

In [76]:
from scipy.stats import norm
import numpy as np

intervalo_de_confianza = norm.interval(confidence=0.90, loc=media_muetral, scale=desviacion_std / np.sqrt(n))
intervalo_de_confianza

(np.float64(27.592969951356466), np.float64(28.407030048643534))

# **Calculando el tamaño de la muestra**

El valor promedio gastado por los clientes en una tienda es de `$ 45.50`. Suponiendo que la desviación estándar de los gastos es de `$ 15.00`, ¿cuál debería ser el tamaño de la muestra para estimar la media de la población con un nivel de significancia del 10%?

Tenga en cuenta que el error máximo aceptable es del 10%.

In [100]:
from scipy.stats import norm

media = 45.5
sigma = 15
significancia = 0.10
confianza = 1 - significancia

z = norm.ppf(0.5 + (confianza / 2))
error_porcentual = 0.10
e = media * error_porcentual

n = (z * (sigma / e)) ** 2
n.round()

np.float64(29.0)

# **Muestra de sacos de harina**

Un faricante de harina encontró que, en una muetra aleatoria compuesta por 200 sacos de 25 kg de un lote compuetao por 2000 sacos, mostraba una desviación estándar muestral del peso igual a 480 g.

Considerando un error máximo asociado con el promedio poblacional de 0.3 kg y un nivel de confianza de 95%, ¿qué tamaño de muestra debe seleccionarse para otener una estimación confiable del parámetro polacional?

#### Con desviación estándar conocida

## $$n = \frac{z^2 \sigma^2 N}{z^2 \sigma^2 + e^2(N-1)}$$

#### Con desviación estándar desconocida

## $$n = \frac{z^2 s^2 N}{z^2 s^2 + e^2(N-1)}$$

## Donde:

$N$ = tamaño de la población

$z$ = variable normal estandarizada

$\sigma$ = desviación estándar poblacional

$s$ = desviación estándar muestral

$e$ = error inferencial

In [101]:
# Obteniendo N
N = 2000

In [102]:
# Obteniendo z
z = norm.ppf((0.5 + (0.95 / 2)))
z

np.float64(1.959963984540054)

In [105]:
# Oteniendo s
s = 480

In [109]:
# Obteniendo e
e = 0.3 * 1000   # Convirtiendo kg para g

In [111]:
from scipy.stats import norm
import numpy as np

# Calculando n
n = ((z ** 2) * (s ** 2) * N) / (((z ** 2) * (s ** 2)) + ((e ** 2) * (N - 1)))
int(n.round())

10