# Estimación de Proporciones con Muestreo por Conglomerados
Este notebook analiza un caso moderno en el que se estima la proporción de empleados que usan apps de salud mental, usando muestreo por conglomerados.

In [None]:
import pandas as pd
import numpy as np

# Cargar muestra
df = pd.read_csv("uso_apps_salud_mental_muestra.csv")
df.head()

In [None]:
# Proporción por conglomerado

proporciones = df.groupby('Empresa')['Usa_App_Salud_Mental'].mean()
media_proporcion = proporciones.mean()

print(f"Proporción estimada de uso: {media_proporcion:.4f}")

In [None]:
varianza_proporciones = proporciones.var(ddof=1)
error_std = np.sqrt(varianza_proporciones / len(proporciones))

print(f"Varianza entre conglomerados: {varianza_proporciones:.6f}")
print(f"Error estándar: {error_std:.4f}")

In [None]:
from scipy.stats import t

gl = len(proporciones) - 1
t_crit = t.ppf(0.975, df=gl)
margen_error = t_crit * error_std
IC_95 = (media_proporcion - margen_error, media_proporcion + margen_error)

print(f"IC 95% para la proporción: {IC_95}")

In [None]:
from scipy.stats import norm

Z_95 = norm.ppf(0.975)
E = 0.03  # 3% de margen de error

n_req = (Z_95**2 * varianza_proporciones) / E**2
print(f"Empresas necesarias para error ≤ 3% con 95% confianza: {np.ceil(n_req)}")