# Estadística Inferencial

## 1. Estimadores y sus Propiedades

Un **estimador** es una función de la muestra que se utiliza para aproximar un parámetro poblacional.

### Ejemplos de estimadores:
- Media muestral $\bar{X} $ estima la media poblacional $\mu$
- Varianza muestral $S^2$ estima la varianza poblacional $\sigma^2$

### Propiedades deseables de los estimadores:
- **Insesgadez**: $\mathbb{E}[\hat{\theta}] = \theta$
- **Consistencia**: $\hat{\theta} \xrightarrow{p} \theta$ conforme $n \to \infty$
- **Eficiencia**: menor varianza entre todos los estimadores insesgados
- **Suficiencia**: resume toda la información relevante de la muestra respecto al parámetro


## 2. Intervalos de Confianza

Un **intervalo de confianza (IC)** es un rango de valores que probablemente contenga el valor verdadero del parámetro poblacional con una cierta probabilidad (nivel de confianza).

### Intervalo de confianza para la media cuando $\sigma$ es desconocida:

Para muestras grandes o uso de la t de Student:

$$\left( \bar{x} - t_{\alpha/2} \cdot \frac{s}{\sqrt{n}}, \ \bar{x} + t_{\alpha/2} \cdot \frac{s}{\sqrt{n}} \right)$$


In [4]:
import numpy as np
from scipy import stats

# Simulación de muestra
np.random.seed(0)
muestra = np.random.normal(loc=50, scale=10, size=30)

media = np.mean(muestra)
desv = np.std(muestra, ddof=1)
n = len(muestra)
confianza = 0.95

t_critico = stats.t.ppf(1 - (1 - confianza)/2, df=n-1)
margen_error = t_critico * (desv / np.sqrt(n))

li = media - margen_error
ls = media + margen_error

# Salida más legible
print(f"Intervalo de confianza del 95% para la media: ({li:.2f}, {ls:.2f})")

Intervalo de confianza del 95% para la media: (50.32, 58.54)


## 3. Pruebas de Hipótesis

Es un procedimiento estadístico para decidir si aceptamos o rechazamos una afirmación sobre un parámetro poblacional.

### Elementos clave:

- **Hipótesis nula (H₀)**: afirmación que se quiere contrastar
- **Hipótesis alternativa (H₁)**: lo que se plantea si se rechaza H₀
- **Estadístico de prueba**: valor calculado a partir de la muestra
- **Valor-p (p-value)**: probabilidad de obtener un resultado al menos tan extremo como el observado, bajo H₀
- **Nivel de significancia** \( \alpha \): umbral para rechazar H₀ (típicamente 0.05)

### Tipos de prueba:
- Prueba bilateral: $H_0: \mu = \mu_0, \ H_1: \mu \neq \mu_0$
- Prueba unilateral izquierda: $ H_0: \mu \geq \mu_0 \, \ H_1: \mu < \mu_0$
- Prueba unilateral derecha:  $H_0: \mu \leq \mu_0 \, \ H_1: \mu > \mu_0$


In [2]:
# Prueba t de una muestra
mu_hipotesis = 52
t_stat, p_value = stats.ttest_1samp(muestra, mu_hipotesis)

print(f"Estadístico t: {t_stat:.3f}")
print(f"Valor p: {p_value:.3f}")

alpha = 0.05
if p_value < alpha:
    print("Se rechaza H0: la media es significativamente distinta de", mu_hipotesis)
else:
    print("No se rechaza H0: no hay evidencia suficiente para decir que la media es distinta de", mu_hipotesis)

Estadístico t: 1.209
Valor p: 0.236
No se rechaza H0: no hay evidencia suficiente para decir que la media es distinta de 52
