# Actividad
Cierta compañía aérea ha requerido de sus servicios profesionales para
llevar a cabo un estudio relacionado con la cantidad de pasajeros que
llegan al país en vuelos internacionales, dicho estudio tiene relación con
la enfermedad de COVID-19. De acuerdo a la información que maneja la
compañía, la cantidad de pasajeros que llegan en vuelos internacionales
se comporta aproximadamente normal con una media de 120 pasajeros
y una varianza de 25. $\newline$
A) Asumiendo que cada día llegan a Santiago 16 vuelos
internacionales, determine la probabilidad que durante el año (52
semanas) la cantidad total de pasajeros sea de al menos de
699500.$\newline$ 
B) De acuerdo con registros históricos se sabe que aproximadamente
un 7% de los pasajeros son niños. Considerando un potencial de
400 pasajeros que llegarían en los próximos días, determine la
probabilidad que menos de un 5% sean niños.

In [10]:
import numpy as np
from scipy.stats import norm
import math
from scipy import stats

### Actividad 1

In [None]:
# Anotamos los valores conocidos

media_diaria = 120
varianza_diaria = 25
desviacion_estandar = np.sqrt(varianza_diaria)
vuelos_diarios = 16
dias_anuales = 52*7

# Como nos pide la probabilidad anual, pasamos los datos a valores anuales

media_anual = media_diaria*vuelos_diarios*dias_anuales
varianza_anual = varianza_diaria*vuelos_diarios*dias_anuales
desviacion_anual = np.sqrt(varianza_anual)

# Ahora calculamos la probabilidad calculando primeramente el valor de z

z = (699500 - media_anual) / desviacion_anual
prob_a = 1 - stats.norm.cdf(z)

print("--- Parte a ---")
print(f"Media anual: {media_anual:.2f} pasajeros")
print(f"Desviación estándar anual: {desviacion_anual:.2f}")
print(f"Z calculado: {z:.4f}")
print(f"Probabilidad de ≥ 699,500 pasajeros: {prob_a:.6f} o {prob_a*100:.4f}%")

# para el apartado b)

n_pasajeros = 400
p_ninos = 0.07
umbral = 0.05

# Luego calculamos los valores que necesitamos

media_ninos = n_pasajeros * p_ninos
varianza_ninos = n_pasajeros * p_ninos * (1 - p_ninos)
desviacion_ninos = np.sqrt(varianza_ninos)

z_b = (19.5 - media_ninos) / desviacion_ninos
prob_b = stats.norm.cdf(z_b)

print("\n--- Parte b ---")
print(f"Media de niños esperada: {media_ninos:.2f}") 
print(f"Desviación estándar: {desviacion_ninos:.2f}")
print(f"Z calculado: {z_b:.4f}")
print(f"Probabilidad de <5% niños: {prob_b:.6f} o {prob_b*100:.4f}%")


# NOTA: el :.4f es para denotar la cantidad de decimales que quise mostrar, en todo los casos fue de 4


--- Parte a ---
Media anual: 698880.00 pasajeros
Desviación estándar anual: 381.58
Z calculado: 1.6248
Probabilidad de ≥ 699,500 pasajeros: 0.052098 o 5.2098%

--- Parte b ---
Media de niños esperada: 28.00
Desviación estándar: 5.10
Z calculado: -1.6657
Probabilidad de <5% niños: 0.047886 o 4.7886%


#### Conclusión:
Podemos notar que no hay evidencia que permita afirmar que el número total de pasajeros aumentará los 699500.
Así como para los niños se rechaza la hipótesis ya que el p encontrado es menor que el nivel de significancia.

### Actividad 2

Una empresa que se dedica a hacer en cuestas se queja de que un agente
realiza en promedio 53 encuestas por semana. Se ha introducido una
forma más moderna de realizar las encuetas y la empresa quiere evaluar
su efectividad. Los números de encuestas realizadas en una semana por
una muestra aleatoria de agentes son:

| 53 | 57 | 50 | 55 | 58 |
|----|----|----|----|----|
| 54 | 60 | 52 | 59 | 62 |
| 60 | 60 | 51 | 59 |    |

En el nivel de significancia 0,05, puede concluirse que la cantidad media
de entrevistas realizadas por los agentes es superior a 53 por semana?
Evalúe el valor p.



In [None]:
# Anotamos los valores conocidos
encuestas = np.array([53, 57, 50, 55, 58, 54, 60, 52, 59, 62, 60, 60, 51, 59])
n = len(encuestas)
media_historica = 53
alfa = 0.05

# Calculamos los valores estadísticos necesarios

media_muestral = np.mean(encuestas)
desviacion_muestra = np.std(encuestas, ddof=1)
error_estandar = desviacion_muestra/np.sqrt(n)

print("--- Estadísticos Descriptivos ---")
print(f"Tamaño de muestra (n): {n}")
print(f"Media muestral: {media_muestral:.2f} encuestas/semana")
print(f"Desviación estándar muestral: {desviacion_muestra:.2f}")
print(f"Error estándar: {error_estandar:.2f}")
 
 # Luego realizamos una prueba t de Strudent
 
t = (media_muestral - media_historica) / error_estandar
grados_libertad = n - 1

# Calculamos el valor crítico
t_critico = stats.t.ppf(1 - alfa, grados_libertad)

# Valor p 
p_valor = 1 - stats.t.cdf(t, grados_libertad)

# Luego tomamos la decisión

if t > t_critico:
    decision = "Rechazamos H₀: Hay evidencia de mejora (media > 53)"
else:
    decision = "No rechazamos H₀: No hay evidencia suficiente de mejora"

print("\n--- Resultados de la Prueba de Hipótesis ---")
print(f"Estadístico t calculado: {t:.4f}")
print(f"Valor crítico (α=0.05): {t_critico:.4f}")
print(f"Valor p: {p_valor:.6f}")
print(f"Conclusión: {decision}")

# NOTA: el :.4f es para denotar la cantidad de decimales que quise mostrar, en todo los casos fue de 4

--- Estadísticos Descriptivos ---
Tamaño de muestra (n): 14
Media muestral: 56.43 encuestas/semana
Desviación estándar muestral: 3.88
Error estándar: 1.04

--- Resultados de la Prueba de Hipótesis ---
Estadístico t calculado: 3.3087
Valor crítico (α=0.05): 1.7709
Valor p: 0.002826
Conclusión: Rechazamos H₀: Hay evidencia de mejora (media > 53)


#### Conclusión
Con el nivel de significancia dado (5%) y los cálculos realizados se tiene que la nueva metodología ha aumentado significativamente el número de encuestas promedio

### Actividad 3
Ejercicio 3
En el último año, se determinó que el tiempo promedio que los
estudiantes pasaron resolviendo un examen fue de 65 minutos, con una
desviación estándar de 10 minutos. Este año, se seleccionó una muestra
aleatoria de 50 estudiantes, y se encontró que el tiempo promedio que
tomaron resolviendo el mismo examen fue de 68 minutos.
Considerando que el objetivo es evaluar si hay evidencia suficiente para
afirmar que el tiempo promedio ha aumentado este año en comparación
con el último, se plantea la siguiente prueba de hipótesis con un nivel de
significancia del 5%: $\newline$
• Hipótesis nula (H0): El tiempo promedio este año (μ) es igual al
tiempo promedio del año pasado (μ0): μ=μ0 $\newline$
• Hipótesis alternativa (H1): El tiempo promedio este año (μ) es
mayor al tiempo promedio del año pasado (μ0): μ>μ0 $\newline$
Se dispone de la desviación estándar poblacional (σ) del año pasado, lo
que permite utilizar una prueba Z para la media poblacional.$\newline$
Pregunta:$\newline$
1. Calcule el estadístico de prueba Z utilizando los datos
proporcionados.$\newline$
2. ¿Qué conclusión se puede obtener con respecto a las hipótesis nula
y alternativa basándose en el valor calculado de Z y el valor crítico
correspondiente para un nivel de significancia del 5%?

In [None]:
# Definimos las variables que conocemos

media_poblacional = 65 # Media poblacional bajo la hipotesis
desviacion_poblacional = 10
media_muestral_3 = 68
tamaño_muestra = 50
significancia = 0.05

# Ahora calculamos el valor de z

error_estandar_3 = desviacion_poblacional/np.sqrt(tamaño_muestra)

z_3 = (media_muestral_3 - media_poblacional)/error_estandar_3

# Ahora determinamos el valor crítico de z

z_critico_3 = stats.norm.ppf(1 - significancia)

# Y por último calculamos el valor de p

p_valor_3 = 1 - stats.norm.cdf(z_3)

# Finalmente escribimos el código para la toma de decision

if z_3 > z_critico_3:
    decision_3 = "Rechazamos H₀: Hay evidencia de que el tiempo aumentó"
else:
    decision_3 = "No rechazamos H₀: No hay evidencia suficiente de aumento"

print("\n--- Conclusión ---")
print(f"Comparación: Z calculado ({z:.4f}) vs Z crítico ({z_critico_3:.4f})")
print(f"Valor p vs alfa: {p_valor_3:.4f} vs {desviacion_poblacional}")
print(f"Decisión: {decision_3}")

# NOTA: el :.4f es para denotar la cantidad de decimales que quise mostrar, en todo los casos fue de 4


--- Conclusión ---
Comparación: Z calculado (1.6248) vs Z crítico (1.6449)
Valor p vs alfa: 0.0169 vs 10
Decisión: Rechazamos H₀: Hay evidencia de que el tiempo aumentó


#### Conclusion:

Dándonos cuenta que, con el nivel de significancia existe evidencia de que el tiempo respecto al año anterior aumentó
