# Estadística Inferencial

"Hay muchas formas de tomar decisiones o predicciones, algunas son subjetivas y otras son objetivas por naturaleza. ¿Qué tan buenas serán las predicciones o decisiones? Es la función del estadístico matemático dar métodos de toma de inferencia estadística que son mejores y más confiables que únicamente cálculos subjetivos."  

## Estimadores

Cuando se quiere estimar el valor de un parámetro poblacional, se puede usar información de la muestra en la forma de un *estimador*. 

*Estimadores:* es una función de la muestra aleatoria que se usa para aproximar un parámetro desconocido de la población.

### Propiedades de los estimadores

- **Insesgamiento:** 
  
  Se dice que un estimador de un parámetro es insesgado si la media de su distribución es igual al verdadero valor del parámetro. El estimador no debe subestimar o sobreestimar de manera consistente el parámetro de interés. De otro modo, se dice que el estimador está sesgado.
  $$ \mathbb{E}[\hat{\theta}] = \theta$$

- **Consistencia:**
  
  Esta propiedad considera que el estimador converge en probabilidad al parámetro cuando el tamaño de la muestra crece a infinito. Es decir, si $\hat{\theta}_n$ es un estimador para $\theta$ basado en una m.a. de tamaño n. $\hat{\theta}_n$ es consistente si para cualquier $\varepsilon > 0$
  $$ \lim_{n\to\infty} \mathbb{P}(|\hat{\theta}_n - \theta|>\varepsilon) = 0$$
  otra notación es $\hat{\theta}_n \xrightarrow{p}\theta$

- **Eficiencia:**

  La dispersión (medida por la varianza) de la distribución muestral debe ser tan pequeña como sea posible. Esto asegura que, con una alta probabilidad, una estimación individual caerá cerca del valor verdadero del parámetro.

### Métodos para construir estimadores

#### Método de momentos 

Consiste en igualar los momentos poblacionales con los momentos muestrales y resolver la ecuación, o sistema de ecuaciones , para el parámetro o vector de parámetros, cuando sea posible. 
 
 - Momento poblacional: Sea $k \geq 1$ un entero. El $k$-ésimo momento de una variable aleatoria $X$, es el número $\mathbb{E}[X^k]$.
 - Momento muestral: Sea $k \geq 1$ un entero. El $k$-ésimo momento de una muestra aleatoria $X_1,\dots,X_n$ es la variable aleatoria $m_k = \frac{1}{n} \sum_{i=1}^{n}X_i^k$_

**Ejemplo**

El tiempo de retardo para pacientes con enfermedad coronaria potencial se define como la duración entre el comienzo de un síntoma agudo cardiovascular y la llegada a la unidad de emergencia.
Se supone que el tiempo de retardo sigue una distribución exponencial con parámetro $\theta $.
Se registraron los tiempos de retardo (en minutos) en la clínica para los primeros 20 pacientes:
$$ 525, \ 719, \ 2880, \ 150, \ 30, \ 251, \ 45, \ 858, \ 15, \ 47, \ 90, \ 56, \ 68, \ 6, \ 189, \ 180, \ 60, \ 60, \ 294, \ 747 $$
- Encuentra un estimador por el **método de momentos** para la media de la distribución (exponencial).
  Recordemos que si $X\sim Exp(\theta)$, entonces $\mathbb{E}[X]=\frac{1}{\theta}$
- (Python) Encuentra el valor del estimador con los datos dados.

**Inciso 1**

Sabemos que para una distribución exponencial $\mathbb{E}[X] = \frac{1}{\theta}$ y que el momento muestral $m_1 = \frac{1}{n}\sum_{i=1}^{n}x_i$, igualando los momentos obtenemos 
$$ \frac{1}{\theta} = \frac{1}{n}\sum_{i=1}^{n}x_i = \bar{x}$$
y despejando, llegamos al estimador 
$$ \hat{\theta} = \frac{1}{\bar{x}}$$

**Inciso 2**
  

In [None]:
# Llamamos a las librerias que ocuparemos
import numpy as np

# Creamos un arreglo con los datos 
datos = np.array([525, 719, 2880, 150, 30, 251, 45, 858, 15, 47, 
                 90, 56, 68, 6, 189, 180, 60, 60, 294, 747])

# Calculamos la media 
media = np.mean(datos)

# Calculamos el estimador
theta_hat = 1/media

# Imprimimos el valor del estimador
print('El valor del estimador es:',theta_hat)

El valor del estimador es: 0.002751031636863824


#### Método de máxima verosimilitud

La *función de verosimilitud* de un vector aleatorio $ (X_1,\dots,X_n)$ cuya distribución depende de un parámetro $\theta$ se define como la función de densidad 
$$L(\theta) = f_{X_1,\dots,X_n}(x_1,\dots,x_n;\theta) $$
y cuando hay distribución idéntica de $X_i$ se calcula de la siguiente manera
$$ L(\theta) = f(x_1;\theta)\cdots f(x_n;\theta) = \prod_{i=1}^{n}f(x_i;\theta).$$

El método consiste en encontrar el valor de $\theta$ que maximiza a la función $L(\theta)$. Al valor de $\theta$ en donde $L(\theta)$ alcanza su máximo se le llama estimación de máxima verosimilitud o estimación máximo verosímil.

**Observación**
$$\begin{align*} \log{L(\theta)} &=  \log{\prod_{i=1}^{n}f(x_i;\theta)} \\ &= \sum_{i=1}^{n} \log{f(x_i;\theta)} \end{align*}$$

**Ejemplo.** 

Sea $x_1,\dots,x_n$ una m.a $Poisson(\lambda)$
$$ f(x_i;\lambda) = e^{-\lambda}\frac{\lambda^{x_i}}{x_i !}, \quad i\in\{1,2,\dots,n\}$$
1. Encontrar EMV
2. ¿es insesgado?
3. ECM

**Inciso 1**

$$L(x_1\dots x_n;\theta) = \prod_{i=1}^{n} e^{-\theta}\frac{\theta^{x_i}}{x_i !} = \frac{e^{-n\theta}\theta^{\sum x_i}}{x_1!\dots x_n!}$$

$$\log{L(x_1\dots x_n;\theta)} = \log{e^{-n\theta}\theta^{\sum x_i}} - \log{x_1!\dots x_n!} = -n\theta + \sum x_i \log{\theta} - \sum \log{x_i!}$$
derivando $L(x_i;\theta)$ e igualando a cero
$$ \frac{dL(x_i;\theta)}{d\theta} = -n + \frac{\sum x_i}{\theta} = 0$$
así
$$ \frac{\sum x_i}{\theta} = n \rightarrow  \theta = \frac{\sum x_i}{n} \quad \text{entonces} \quad \hat{\theta} = \bar{x}$$

**Inciso 2**
$$ \mathbb{E}[\hat{\theta}] = \mathbb{E}\left[\frac{\sum x_i}{n}\right] = \frac{1}{n}\sum \mathbb{E}[x_i] = \frac{1}{n}\sum \theta = \frac{n\theta}{n} = \theta $$

**Inciso 3**
$$\begin{align*}ECM(\hat{\theta}) &= Var(\hat{\theta}) + (\mathbb{E}[\hat{\theta}]-\theta)^2 = Var\left(\frac{\sum x_i}{n} \right) + 0 \\ &= \frac{1}{n^2} \sum Var(x_i) = \frac{1}{n^2} \sum \theta = \frac{n\theta}{n^2} = \frac{\theta}{n} \end{align*}$$
disminuye a medida que aumenta la cantidad de datos.

## Intervalos de confianza 