## Bloque 1: Intervalos de confianza para una media

### Caso 1: Varianza conocida, población normal

Un sensor industrial reporta lecturas de temperatura cada hora. El fabricante afirma que su desviación estándar es constante en 2.5°C. Se toman 36 muestras y se desea estimar el verdadero valor promedio de la temperatura.

In [15]:
import numpy as np
from scipy.stats import norm

# Datos simulados
np.random.seed(0)
datos = np.random.normal(loc=75, scale=2.5, size=36)

media_muestra = np.mean(datos)
std_poblacional = 2.5
n = len(datos)
alfa = 0.05

z = norm.ppf(1 - alfa/2)
error = z * (std_poblacional / np.sqrt(n))

IC = (media_muestra - error, media_muestra + error)
print(f'IC con var conocida y población normal: ({IC[0]:.2f},{IC[1]:.2f})')

Intervalo de Confianza con varianza conocida y población normal: (74.93,76.56)


### Caso 2: Varianza desconocida, población normal

Una planta embotelladora controla la cantidad de líquido en botellas de 500 ml. Se sabe que la muestra proviene de una población normal y se desea estimar la media real con base en una muestra de 15 botellas.

In [16]:
from scipy.stats import t

# Datos
muestra = np.array([499, 502, 501, 498, 500, 497, 499, 503, 500, 502, 501, 499, 498, 500, 501])
media = np.mean(muestra)
desv_est = np.std(muestra, ddof=1)
n = len(muestra)
t_crit = t.ppf(1 - alfa/2, df=n-1)

error = t_crit * desv_est / np.sqrt(n)
IC = (media - error, media + error)
print(f'IC con varianza desconocida y población normal: ({IC[0]:.2f},{IC[1]:.2f})')

IC con varianza desconocida y población normal: (499.06,500.94)


### Caso 3: No normal, n > 30

Un sitio web registra el tiempo (en segundos) que tardan los usuarios en completar un formulario. Los tiempos son asimétricos pero se registraron más de 50 observaciones.

In [17]:
# datos asimétricos
datos = np.random.exponential(scale=50, size=60)

media = np.mean(datos)
desv_est = np.std(datos, ddof=1)
n = len(datos)

z = norm.ppf(1 - alfa/2)
error = z * (desv_est / np.sqrt(n))
IC = (media - error, media + error)
print(f'IC para media no normal y varianza desconocida:({IC[0]:.2f},{IC[1]:.2f})')

IC para media no normal y varianza desconocida:(28.64,53.36)


## Bloque 2: Intervalos para diferencia de medias



### Caso 1: Varianzas conocidas, población no normal

Dos líneas de ensamblaje producen ejes metálicos. Se conoce que las desviaciones estándar históricas son constantes. Se desea comparar sus medias.

In [10]:
x1, x2 = 102.3, 100.8
s1, s2 = 1.5, 1.2
n1, n2 = 40, 35

error = norm.ppf(1 - alfa/2) * np.sqrt((s1**2 / n1) + (s2**2 / n2))
dif_media = x1 - x2
IC = (dif_media - error, dif_media + error)
print(f'IC diferencia de medias no normales con varianzas conocidas:({IC[0]:.2f},{IC[1]:.2f})')

IC diferencia de medias con varianzas conocidas:(0.89,2.11)


### Caso 2: Varianzas desconocidas pero iguales, población normal

Dos laboratorios miden niveles de glucosa en pacientes. Se supone que tienen varianzas similares y distribuciones normales. Comparar sus promedios.

In [11]:
# Muestras
lab1 = np.array([89, 92, 91, 90, 93, 89, 88, 90])
lab2 = np.array([85, 87, 86, 88, 85, 86, 87, 84])

n1, n2 = len(lab1), len(lab2)
s1, s2 = np.std(lab1, ddof=1), np.std(lab2, ddof=1)
sp = np.sqrt(((n1 - 1) * s1**2 + (n2 - 1) * s2**2) / (n1 + n2 - 2))
media1, media2 = np.mean(lab1), np.mean(lab2)

t_crit = t.ppf(1 - alfa/2, df=n1 + n2 - 2)
error = t_crit * sp * np.sqrt(1/n1 + 1/n2)
IC = ((media1 - media2) - error, (media1 - media2) + error)
print(f'IC diferencia de medias con varianzas iguales:({IC[0]:.2f},{IC[1]:.2f})')

IC diferencia de medias con varianzas iguales:(2.64,5.86)


### Caso 3: No normal, muestras grandes, varianzas desconocidas

Se comparan los tiempos promedio de carga entre dos servidores web diferentes. Se recolectan 40 observaciones por grupo.

In [12]:
servidor1 = np.random.exponential(scale=4, size=40)
servidor2 = np.random.exponential(scale=5, size=40)

x1, x2 = np.mean(servidor1), np.mean(servidor2)
s1, s2 = np.std(servidor1, ddof=1), np.std(servidor2, ddof=1)
n1, n2 = len(servidor1), len(servidor2)

z = norm.ppf(1 - alfa/2)
error = z * np.sqrt(s1**2 / n1 + s2**2 / n2)
IC = (x1 - x2 - error, x1 - x2 + error)
print(f'IC diferencia de medias para datos no normales:({IC[0]:.2f},{IC[1]:.2f})')

IC diferencia de medias para datos no normales:(-3.58,0.75)


## Bloque 3: Intervalo de confianza para proporciones

### Caso: Proporción de usuarios que hacen clic en un anuncio

De una muestra de 1200 usuarios que vieron un anuncio, 138 hicieron clic. Estimar la proporción real.

In [13]:
n = 1200
x = 138
p_hat = x / n
z = norm.ppf(1 - alfa/2)
error = z * np.sqrt(p_hat * (1 - p_hat) / n)
IC = (p_hat - error, p_hat + error)
print(f'IC para una proporción:({IC[0]:.2f},{IC[1]:.2f})')

IC para una proporción:(0.10,0.13)
