# Lab | Intro to Probability

**Objective**

Welcome to this Intro to Probability lab, where we explore decision-making scenarios through the lens of probability and strategic analysis. In the business world, making informed decisions is crucial, especially when faced with uncertainties. This lab focuses on scenarios where probabilistic outcomes play a significant role in shaping strategies and outcomes. Students will engage in exercises that require assessing and choosing optimal paths based on data-driven insights. The goal is to enhance your skills by applying probability concepts to solve real-world problems.

In [None]:
"""
Bienvenido a este laboratorio de Introducción a la Probabilidad, donde exploraremos escenarios de toma de decisiones a través de la lente de la probabilidad y el análisis estratégico. En el mundo de los negocios, la toma de decisiones informadas es crucial, especialmente cuando nos enfrentamos a incertidumbres. Este laboratorio se centra en escenarios en los que los resultados probabilísticos desempeñan un papel importante en la configuración de estrategias y resultados. Los estudiantes participarán en ejercicios que requieren la evaluación y elección de caminos óptimos basados en datos. 
El objetivo es mejorar sus habilidades mediante la aplicación de conceptos de probabilidad para resolver problemas del mundo real.
"""

**Challenge 1**

#### Ironhack Airlines 

Often Airlines sell more tickets than they have seats available, this is called overbooking. Consider the following:
- A plane has 450 seats. 
- Based on historical data we conclude that each individual passenger has a 3% chance of missing it's flight. 

If the Ironhack Airlines routinely sells 460 tickets, what is the chance that they have a seats for all passenger?

In [None]:
"""
Aerolíneas Ironhack 

A menudo, las aerolíneas venden más billetes de los que tienen disponibles, lo que se denomina overbooking. Considere lo siguiente:
- Un avión tiene 450 plazas. 
- Basándonos en datos históricos, llegamos a la conclusión de que cada pasajero tiene un 3% de posibilidades de perder su vuelo. 

Si la aerolínea Ironhack vende habitualmente 460 billetes, ¿cuál es la probabilidad de que tenga asientos para todos los pasajeros?
"""

In [1]:
import scipy.stats as stats
import math

# Parámetros dados
n = 460  # Número de billetes vendidos
p = 0.97  # Probabilidad de que un pasajero llegue
X = 450  # Número máximo de pasajeros que podemos aceptar

# Paso 1: Calcular la media (mu) y la desviación estándar (sigma) de la distribución binomial
mu = n * p  # Media
sigma = math.sqrt(n * p * (1 - p))  # Desviación estándar

# Paso 2: Calcular el valor Z para X = 450
Z = (X - mu) / sigma

# Paso 3: Usar la distribución normal acumulada para obtener la probabilidad P(X <= 450)
probabilidad = stats.norm.cdf(Z)

# Imprimir el resultado
print(f"La probabilidad de que haya 450 o menos pasajeros es: {probabilidad:.4f}")

La probabilidad de que haya 450 o menos pasajeros es: 0.8505


**Challenge 2**

#### Ironhack Call Center 

Suppose a customer service representative at a call center is handling customer complaints. Consider the following:
- The probability of successfully resolving a customer complaint on the first attempt is 0.3. 


What is the probability that the representative needs to make at least three attempts before successfully resolving a customer complaint?

In [None]:
""" 
Ironhack Call Center 

Supongamos que un representante del servicio de atención al cliente de un centro de llamadas se ocupa de las reclamaciones de los clientes. Considere lo siguiente:
- La probabilidad de resolver con éxito una reclamación de un cliente en el primer intento es de 0,3. 


¿Cuál es la probabilidad de que el representante tenga que hacer al menos tres intentos antes de resolver con éxito una reclamación de un cliente?
"""

In [None]:
# Opción de resolución 1

# Datos
probabilidad_exito = 0.3
probabilidad_fracaso = 1 - probabilidad_exito

# Probabilidad de que se necesiten al menos 3 intentos
probabilidad_al_menos_3_intentos = probabilidad_fracaso * probabilidad_fracaso

# Mostrar el resultado
print(f"La probabilidad de que el representante necesite al menos 3 intentos es: {probabilidad_al_menos_3_intentos:.2f}")

La probabilidad de que el representante necesite al menos 3 intentos es: 0.49


In [None]:
# Opción de resolución 2

import scipy.stats as stats

# Datos
probabilidad_exito = 0.3

# Probabilidad de que se necesiten al menos 3 intentos
# La distribución geométrica en scipy usa la función "sf" para la probabilidad de éxito complementaria
probabilidad_al_menos_3_intentos = stats.geom.sf(2, probabilidad_exito)  # sf(k) = P(X > k)

# Mostrar el resultado
print(f"La probabilidad de que el representante necesite al menos 3 intentos es: {probabilidad_al_menos_3_intentos:.2f}")

La probabilidad de que el representante necesite al menos 3 intentos es: 0.49


**Challenge 3**

#### Ironhack Website

Consider a scenario related to Ironhack website traffic. Where:
- our website takes on average 500 visits per hour.
- the website's server is designed to handle up to 550 vists per hour.


What is the probability of the website server being overwhelmed?

In [None]:
""" 
Consideremos un escenario relacionado con el tráfico del sitio web Ironhack. Donde
- nuestro sitio web recibe una media de 500 visitas por hora.
- el servidor del sitio web está diseñado para soportar hasta 550 visitas por hora.


¿Cuál es la probabilidad de que el servidor del sitio web se vea desbordado?
"""

In [4]:
# Parámetros del problema
lambda_visitas = 500  # Media de visitas por hora
umbral = 550  # Umbral de visitas para que el servidor se vea desbordado

# Calcular la probabilidad acumulada de que haya 550 o menos visitas
probabilidad_hasta_550 = stats.poisson.cdf(umbral, lambda_visitas)

# Calcular la probabilidad de que el servidor se vea desbordado
probabilidad_desbordamiento = 1 - probabilidad_hasta_550

# Mostrar el resultado
print(f"La probabilidad de que el servidor se vea desbordado es: {probabilidad_desbordamiento:.4f}")

La probabilidad de que el servidor se vea desbordado es: 0.0129


What is the probability of being overwhelmed at some point during a day? (consider 24hours)

In [None]:
"""¿Cuál es la probabilidad de verse desbordado en algún momento del día? (considere 24 horas)"""

In [5]:
# Parámetros del problema
lambda_visitas = 500  # Media de visitas por hora
umbral = 550  # Umbral de visitas para que el servidor se vea desbordado

# Calcular la probabilidad acumulada de que haya 550 o menos visitas
probabilidad_hasta_550 = stats.poisson.cdf(umbral, lambda_visitas)

# Probabilidad de que el servidor se vea desbordado en una hora
probabilidad_hora = 1 - probabilidad_hasta_550

# Calcular la probabilidad de que el servidor se vea desbordado en al menos una hora durante 24 horas
probabilidad_desbordamiento_24h = 1 - (1 - probabilidad_hora) ** 24

# Mostrar el resultado
print(f"La probabilidad de que el servidor se vea desbordado al menos una vez en 24 horas es: {probabilidad_desbordamiento_24h:.4f}")


La probabilidad de que el servidor se vea desbordado al menos una vez en 24 horas es: 0.2677


**Challenge 4**

#### Ironhack Helpdesk

Consider a scenario related to the time between arrivals of customers at a service desk.

On average, a customers arrives every 10minutes.

What is the probability that the next customer will arrive within the next 5 minutes?

In [None]:
""" 
Consideremos un escenario relacionado con el tiempo entre llegadas de clientes a un mostrador de servicio.

Por término medio, llega un cliente cada 10 minutos.

¿Cuál es la probabilidad de que el siguiente cliente llegue en los próximos 5 minutos?
"""

In [6]:
# Parámetros del problema
lambda_cliente = 1 / 10  # Tasa de llegadas (1 cliente cada 10 minutos)
t = 5  # Tiempo en minutos

# Calcular la probabilidad de que el siguiente cliente llegue en 5 minutos
probabilidad_llegada_5min = stats.expon.cdf(t, scale=1/lambda_cliente)

# Mostrar el resultado
print(f"La probabilidad de que el siguiente cliente llegue en los próximos 5 minutos es: {probabilidad_llegada_5min:.4f}")

La probabilidad de que el siguiente cliente llegue en los próximos 5 minutos es: 0.3935


In [None]:
""" 
Respuesta Esperada:
Ejecutando el código, verás que la probabilidad de que el siguiente cliente llegue en los próximos 5 minutos es aproximadamente 0.3935 o 39.35%.

Conclusión:
La probabilidad de que el siguiente cliente llegue en los próximos 5 minutos es aproximadamente 39.35%, basado en una tasa de llegadas promedio de un cliente cada 10 minutos.
"""

If there is no customer for 15minutes, employees can that a 5minutes break.

What is the probability an employee taking a break?

In [None]:
""" 
Si no hay clientes durante 15 minutos, los empleados pueden tomarse un descanso de 5 minutos.

¿Cuál es la probabilidad de que un empleado se tome un descanso?
"""

In [7]:
import numpy as np

# Parámetros del problema
lambda_cliente = 1 / 10  # Tasa de llegadas (1 cliente cada 10 minutos)
t = 15  # Tiempo en minutos durante el cual no llega ningún cliente

# Calcular la probabilidad de que no haya clientes durante 15 minutos
probabilidad_descanso = stats.expon.sf(t, scale=1/lambda_cliente)  # Función de supervivencia

# Mostrar el resultado
print(f"La probabilidad de que un empleado se tome un descanso de 5 minutos es: {probabilidad_descanso:.4f}")

La probabilidad de que un empleado se tome un descanso de 5 minutos es: 0.2231


**Challenge 5**

The weights of a certain species of birds follow a normal distribution with a mean weight of 150 grams and a standard deviation of 10 grams. 

- If we randomly select a bird, what is the probability that its weight is between 140 and 160 grams?

In [8]:
# Parámetros del problema
media = 150  # Media del peso en gramos
desviacion = 10  # Desviación estándar en gramos

# Calcular las probabilidades para 140 y 160 gramos
probabilidad_140 = stats.norm.cdf(140, loc=media, scale=desviacion)
probabilidad_160 = stats.norm.cdf(160, loc=media, scale=desviacion)

# Probabilidad de que el peso esté entre 140 y 160 gramos
probabilidad_intervalo = probabilidad_160 - probabilidad_140

# Mostrar el resultado
print(f"La probabilidad de que el peso del pájaro esté entre 140 y 160 gramos es: {probabilidad_intervalo:.4f}")

La probabilidad de que el peso del pájaro esté entre 140 y 160 gramos es: 0.6827


**Challenge 6**

If the lifetime (in hours) of a certain electronic component follows an exponential distribution with a mean lifetime of 50 hours, what is the probability that the component fails within the first 30 hours?

In [None]:
"""Si la vida útil (en horas) de un determinado componente electrónico sigue una distribución exponencial con una vida media de 50 horas, 
¿cuál es la probabilidad de que el componente falle en las primeras 30 horas?"""

In [9]:
# Parámetros del problema
vida_media = 50  # Vida media del componente en horas
t = 30  # Tiempo en horas para el que queremos calcular la probabilidad de fallo

# Calcular la tasa de fallos (lambda)
lambda_fallo = 1 / vida_media

# Calcular la probabilidad de fallo en las primeras 30 horas
probabilidad_fallo_30 = stats.expon.cdf(t, scale=1/lambda_fallo)

# Mostrar el resultado
print(f"La probabilidad de que el componente falle en las primeras 30 horas es: {probabilidad_fallo_30:.4f}")


La probabilidad de que el componente falle en las primeras 30 horas es: 0.4512
