# INTERVALOS DE CONFIANZA

### Resistencia de materiales en prueba de carga

In [None]:
# Importamos las librerías
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# Datos y parámetros
data = [50.1, 49.5, 51.1, 48.5, 52, 50.13, 49.3, 49.45, 51, 52.2]
n = len(data)
sigma = 0.2
mean_sample = np.mean(data)
alpha_ = 1 - 0.95
conf = (1 - alpha_) * 100

# Z valor
z_value = stats.norm.ppf(1 - alpha_ / 2)

# Intervalo de confianza
ee = z_value * sigma / np.sqrt(n)
IC = (mean_sample - ee, mean_sample + ee)
print(
    f"La media muestral es {mean_sample:.2f} MPa y el intervalo IC = ({IC[0]:.2f},{IC[1]:.2f})"
)
print()

# Visualización
x = np.linspace(
    mean_sample - 4 * sigma / np.sqrt(n), mean_sample + 4 * sigma / np.sqrt(n), 1000
)
y = stats.norm.pdf(x, mean_sample, sigma / np.sqrt(n))
plt.plot(x, y, color="b", label="Distribución normal de la media muestral")
plt.axvline(IC[0], color="r", linestyle="--", label="Intervalo de confianza")
plt.axvline(IC[1], color="r", linestyle="--")
plt.axvline(mean_sample, color="g", linestyle="--", label="Media muestral")
plt.fill_between(x, y, where=(x >= IC[0]) & (x <= IC[1]), alpha=0.4)
plt.title(f"IC al {conf}% para la media con varianza conocida")
plt.legend()
plt.show()

### Número de células

In [None]:
# Importamos las librerías
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# Datos y parámetros
data = [120, 130, 122, 140, 139, 127, 138, 132, 133, 141]
n = len(data)
mean_sample = np.mean(data)
s = np.std(data, ddof=1)  # Divide por n-1
alpha_ = 1 - 0.90
conf = (1 - alpha_) * 100

# t valor
t_value = stats.t.ppf(1 - alpha_ / 2, n - 1)

# Intervalo de confianza
ee = t_value * s / np.sqrt(n)
IC = (mean_sample - ee, mean_sample + ee)
print(
    f"La media muestral es {mean_sample:.2f} células y el intervalo IC = ({IC[0]:.2f},{IC[1]:.2f})"
)
print()

# Visualización
x = np.linspace(
    mean_sample - 4 * s / np.sqrt(n), mean_sample + 4 * s / np.sqrt(n), 1000
)
y = stats.norm.pdf(x, mean_sample, s / np.sqrt(n))
plt.plot(x, y, color="b", label="Distribución t-student de la media muestral")
plt.axvline(IC[0], color="r", linestyle="--", label="Intervalo de confianza")
plt.axvline(IC[1], color="r", linestyle="--")
plt.axvline(mean_sample, color="g", linestyle="--", label="Media muestral")
plt.fill_between(x, y, where=(x >= IC[0]) & (x <= IC[1]), color="orange", alpha=0.5)
plt.title(f"IC al {conf}% para la media con varianza desconocida")
plt.legend()
plt.show()

### Componentes defectuosos en una fábrica

In [None]:
# Importamos librerías
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# Datos del problema
n = 1000  # Tamaño de la muestra
defect = 150
p_hat = defect / n
alpha_ = 1 - 0.95
conf = (1 - alpha_) * 100

# Z valor crítico
z_value = stats.norm.ppf(1 - alpha_ / 2)

# IC
ee = z_value * np.sqrt(p_hat * (1 - p_hat) / n)
IC = (p_hat - ee, p_hat + ee)
print(f"El IC para la proporción de defectuosos es ({IC[0]:.4f},{IC[1]:.4f}).")
print(
    f"El intervalo de defectuosos será entonces ({int(IC[0] * 1000)},{int(IC[1] * 1000)})."
)
print()

# Visualización
x = np.linspace(p_hat - 2 * ee, p_hat + 2 * ee, 1000)
y = stats.norm.pdf(x, loc=p_hat, scale=np.sqrt(p_hat * (1 - p_hat) / n))
plt.plot(x, y, color="b", label="Distribución normal de la proporción muestral")
plt.axvline(IC[0], color="r", linestyle="--", label="Intervalo de confianza")
plt.axvline(IC[1], color="r", linestyle="--")
plt.axvline(p_hat, color="g", linestyle="--", label="Proporción muestral")
plt.fill_between(x, y, where=(x >= IC[0]) & (x <= IC[1]), alpha=0.4)
plt.title(f"IC al {conf}% para la proporción")
plt.legend()
plt.show()

### Concentración de un compuesto químico
En un laboratorio de química se mide la concentración de un compuesto en 15 disoluciones. Se quiere estimar, mediante un IC al 95%, la varianza de las mediciones para evaluar la precisión del método de medición.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# Datos
data = np.array(
    [
        25.3,
        26.1,
        20.4,
        27.2,
        25.5,
        23.0,
        25.6,
        24.3,
        25.2,
        27.4,
        30.0,
        28.4,
        25.3,
        30.9,
        25.1,
    ]
)
n = len(data)
s2 = np.var(data, ddof=1)  # Varianza muestral
alpha_ = 1 - 0.95
conf = (1 - alpha_) * 100  # Nivel de confianza

# Valores críticos chi-cuadrado
chi2_sup = stats.chi2.ppf(1 - alpha_ / 2, df=n - 1)
chi2_inf = stats.chi2.ppf(alpha_ / 2, df=n - 1)

# Intervalo de confianza
IC = ((n - 1) * s2 / chi2_sup, (n - 1) * s2 / chi2_inf)
print(f"La desviación típica muestral es de {np.sqrt(s2):.2f}")
print(f"El intervalo de confianza al 98% para la varianza es ({IC[0]:.3f},{IC[1]:.3f})")
print()

# Visualización
x = np.linspace(-1, 30, 1000)
y = stats.chi2.pdf(x, df=n - 1)
plt.plot(x, y, color="b", label="Distribución Chi-cuadrado")
plt.axvline(IC[0], color="r", linestyle="--", label="Intervalo de confianza")
plt.axvline(IC[1], color="r", linestyle="--")
plt.axvline(s2, color="g", linestyle="--", label="Varianza muestral")
plt.fill_between(x, y, where=(x >= IC[0]) & (x <= IC[1]), color="yellow", alpha=0.5)
plt.title(f"IC al {conf}% para varianza poblacional")
plt.legend(loc="upper right")
plt.show()

### Comparación de la duración de dos tipos de baterías

In [None]:
# Importamos las librerías
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# Datos
sample_1 = np.array([5.5, 4.5, 5.4, 4.5, 5.1, 5.2, 5.4, 5, 5.3, 5, 5.1, 5.2])
sample_2 = np.array([5.1, 5.5, 5.2, 4.4, 5.3, 5.1, 5.5, 5, 5.4, 5.2])
n1, n2 = len(sample_1), len(sample_2)
mean1, mean2 = np.mean(sample_1), np.mean(sample_2)
sigma1, sigma2 = 0.2, 0.25
alpha_ = 1 - 0.95
conf = (1 - alpha_) * 100

# Valor crítico
z_value = stats.norm.ppf(1 - alpha_ / 2)

# Intervalo de confianza
dif_means = mean1 - mean2
ee = z_value * np.sqrt(sigma1**2 / n1 + sigma2**2 / n2)
IC = (dif_means - ee, dif_means + ee)
print(f" El IC al 95% para la diferencia de medias es ({IC[0]:.2f},{IC[1]:.2f})")
print()

# Visualización
x = np.linspace(dif_means - 2 * ee, dif_means + 2 * ee, 1000)
y = stats.norm.pdf(x, loc=dif_means, scale=np.sqrt(sigma1**2 / n1 + sigma2**2 / n2))
plt.plot(x, y, color="b", label="Normal diferencia de medias")
plt.axvline(IC[0], color="r", linestyle="--", label="Intervalo de confianza")
plt.axvline(IC[1], color="r", linestyle="--")
plt.axvline(dif_means, color="g", linestyle="--", label="Diferencia medias muestrales")
plt.fill_between(x, y, where=(x > IC[0]) & (x < IC[1]), alpha=0.5)
plt.title(f"IC al {conf:.1f}% para la diferencia de medias (varianzas conocidas)")
plt.legend(loc="upper left")
plt.show()

### Eficiencia de dos motores en ingeniería mecánica

In [None]:
# Importamos las librerías
import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

# Datos
engine_X = np.array([5.2, 5.3, 5.1, 5.4, 5.2])
engine_Y = np.array([5.0, 5.1, 5.2, 5.3, 5.1])
conf = 0.95
alpha = 1 - conf

# Tamaños de muestras
n_X = len(engine_X)
n_Y = len(engine_Y)
deg_freedom = n_X + n_Y - 2

# Estadísticos muestrales
mean_X = np.mean(engine_X)
s_X = np.std(engine_X, ddof=1)
mean_Y = np.mean(engine_Y)
s_Y = np.std(engine_Y, ddof=1)
s_p = np.sqrt(((n_X - 1) * s_X**2 + (n_Y - 1) * s_Y**2) / (n_X + n_Y - 2))
dif_means = mean_X - mean_Y

# Valor crítico t
t_value = stats.t.ppf(1 - alpha / 2, df=deg_freedom)

# Error
ee = t_value * s_p * np.sqrt(1 / n_X + 1 / n_Y)

# Intervalo de confianza
IC = (dif_means - ee, dif_means + ee)

# Resultados
print(f"La diferencia de medias es {dif_means:.2f}")
print(f"El IC al 95% es ({IC[0]:.2f},{IC[1]:.2f})")
print()
# Visualización
x = np.linspace(dif_means - 3 * ee, dif_means + 3 * ee, 1000)
y = stats.t.pdf(x, df=deg_freedom, loc=dif_means, scale=ee)
plt.plot(x, y, label="Distribución t Student")
plt.axvline(IC[0], color="r", linestyle="--", label="Límites IC")
plt.axvline(IC[1], color="r", linestyle="--")
plt.fill_between(
    x,
    y,
    where=(x >= IC[0]) & (x <= IC[1]),
    color="orange",
    alpha=0.5,
    label="Intervalo de confianza",
)
plt.axvline(dif_means, color="g", linestyle="--", label="Diferencia de medias")
plt.title("Diferencia de medias con varianzas desconocidas pero iguales")
plt.xlabel("Diferencia de medias $(\mu_X-\mu_y)$")
plt.ylabel("Densidad de Probabilidad")
plt.legend(loc="upper right")
plt.show()

### Comparación de la tasa de éxito de dos algoritmos en ingeniería de software

In [None]:
# Importamos las librerías
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Datos
n1, n2 = 100, 120
success1, success2 = 60, 90
p1_hat, p2_hat = success1 / n1, success2 / n2
conf = 0.95
alpha = 1 - conf

# Valor crítico Z
z_value = norm.ppf(1 - alpha / 2)

# IC
dif_p_hat = p1_hat - p2_hat
ee = z_value * np.sqrt((p1_hat * (1 - p1_hat) / n1) + (p2_hat * (1 - p2_hat) / n2))
IC = (dif_p_hat - ee, dif_p_hat + ee)
print(f"La diferencia de proporciones es {dif_p_hat:.2f}")
print(f"El IC al {conf*100:.0f}% es ({IC[0]:.2f},{IC[1]:.2f})")
print()
# Visualización
x = np.linspace(dif_p_hat - 3 * ee, dif_p_hat + 3 * ee, 1000)
y = norm.pdf(x, loc=dif_p_hat, scale=ee)
plt.plot(x, y, label="Distribución normal")
plt.axvline(IC[0], color="r", linestyle="--", label="Intervalo de confianza")
plt.axvline(IC[1], color="r", linestyle="--")
plt.axvline(dif_p_hat, color="g", linestyle="--", label="Diferencia proporciones")
plt.fill_between(x, y, where=(x >= IC[0]) & (x <= IC[1]), alpha=0.5)
plt.title(f"Intervalo de confianza al {conf*100:.0f}%")
plt.legend(loc="upper right")
plt.show()

### Consistencia en resistencias

In [None]:
# Importamos las librerías
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# Datos
engine1 = np.array([5.2, 5.3, 5.1, 5.4, 5.2])
engine2 = np.array([5.8, 5.1, 5.2, 5.8, 5.1])
n1, n2 = len(engine1), len(engine2)
s1, s2 = np.var(engine1, ddof=1), np.var(engine2, ddof=1)
conf = 0.95
alpha = 1 - conf

# Valores críticos F
f_inf = stats.f.ppf(alpha / 2, dfn=n1 - 1, dfd=n2 - 1)
f_sup = stats.f.ppf(1 - alpha / 2, dfn=n1 - 1, dfd=n2 - 1)

# Intervalo de confianza
ratio_var = s1 / s2
IC = (ratio_var / f_sup, ratio_var / f_inf)
print(f"El intervalo de confianza es ({IC[0]:.2f},{IC[1]:.2f})")
print()

# Visualización
x = np.linspace(0, 3, 1000)
y = stats.f.pdf(x, dfn=n1 - 1, dfd=n2 - 1)
plt.plot(x, y, label="Distribución F")
plt.axvline(IC[0], color="r", linestyle="--", label="Intervalo de confianza")
plt.axvline(IC[1], color="r", linestyle="--")
plt.axvline(ratio_var, color="g", linestyle="--", label="Cociente de varianzas")
plt.fill_between(x, y, where=(x >= IC[0]) & (x <= IC[1]), color="m", alpha=0.5)
plt.title(f"Intervalo de confianza al {conf*100}%")
plt.legend()
plt.show()