## Equipo 2

#### Integrantes:
- Contreras Acosta Noel Alejandro
- Perez Alvarado Alfonso
- Rosales Peña Juan Pablo
- Vázquez Corrilo Harold

# Estimador Máximo Verosimil

**Ejemplo 1.** Lanzamos una moneda 100 veces, sabiendo que se obtienen 55 soles. Encontrar el EMV para la probabilidad $p$ de obtener sol en un solo lanzamiento.

Si $X$: el número de soles que se obtiene al lanzar una moneda, se tiene que $X \sim Bin(100,p)$, es decir 
$$f(55 \ \text{soles}; p) = \binom{100}{55} p^{55} (1-p)^{100-55} $$

In [10]:
from scipy.stats import binom
import numpy as np
import sympy # Para calculo simbolico y algebraico
from sympy.abc import x

In [11]:
# Vamos a definir a p como una variable simbolica positiva 
p = sympy.symbols('p',positive=True)

# Definimos f
f = p**55 * (1-p)**(100-55)

# Derivamos f respecto a p
df = sympy.diff(f,p)

# Igualamos la derivada a cero y despejamos p
phat = sympy.solve(df,p)[0]

print(f'El estimador de máxima verosimilitud para p es: {phat}')

El estimador de máxima verosimilitud para p es: 11/20


In [12]:
''' 
Veamos otro ejemplo


Simularemos una muestra de tamaño 100
'''

r = binom.rvs(n=1, p=0.7, size=100)

In [13]:
f = p**x * (1-p)**(1-x)
j = np.prod([f.subs(x,i) for i in r])
logj = sympy.expand_log(sympy.log(j))
phat = sympy.solve(sympy.diff(logj,p),p)[0]
print('El estimador de maxima verosimilitud es:',phat)

El estimador de maxima verosimilitud es: 17/25


**Ejercicio:** El tiempo de retardo para pacientes con enfermedad coronaria potencial se define como la duración entre el comienzo de un síntoma agudo cardiovascular y la llegada a la unidad de emergencia.
Se supone que el tiempo de retardo sigue una distribución exponencial con parámetro $\theta $.
Se registraron los tiempos de retardo (en minutos) en la clínica para los primeros 20 pacientes:
$$ 525, \ 719, \ 2880, \ 150, \ 30, \ 251, \ 45, \ 858, \ 15, \ 47, \ 90, \ 56, \ 68, \ 6, \ 189, \ 180, \ 60, \ 60, \ 294, \ 747 $$
- Encuentra un estimador por el **método de momentos** para la media de la distribución (exponencial).
  Recordemos que si $X\sim Exp(\theta)$, entonces $\mathbb{E}[X]=\frac{1}{\theta}$
- (Python) Encuentra el valor del estimador con los datos dados.

**Inciso 1**

Sabemos que para una distribución exponencial $\mathbb{E}[X] = \frac{1}{\theta}$ y que el momento muestral $m_1 = \frac{1}{n}\sum_{i=1}^{n}x_i$, igualando los momentos obtenemos 
$$ \frac{1}{\theta} = \frac{1}{n}\sum_{i=1}^{n}x_i = \bar{x}$$
y despejando, llegamos al estimador 
$$ \hat{\theta} = \frac{1}{\bar{x}}$$

**Inciso 2**

In [14]:
# Llamamos a las librerias que ocuparemos
import numpy as np

In [17]:
# Creamos un arreglo con los datos 
datos = np.array([525, 719, 2880, 150, 30, 251, 45, 858, 15, 47, 
                 90, 56, 68, 6, 189, 180, 60, 60, 294, 747])

# Calculamos la media 
media = np.mean(datos)

# Calculamos el estimador
theta_hat = 1/media

# Imprimimos el valor del estimador
print('El valor del estimador es:',theta_hat)

El valor del estimador es: 0.002751031636863824


**Ejercicio (Python)**. Suponga que la vida util de los focos de cierta marca, se modela mediante una distribución exponencial de parametro  θ  (desconocido). Probamos 5 focos y encontramos que tienen una vida útil de  2,3,1,3  y  5  años, respectivamente. ¿Cuál es el MLE para  θ ?


In [21]:
# Llamamos a las librerias que ocuparemos 
import numpy as np
import sympy # Para calculo simbolico y algebraico
from sympy.abc import x

# Vamos a definir a t como una variable simbolica positiva 
t = sympy.symbols('t',positive=True)

In [20]:
# Creamos un arreglo con los datos 
r = np.array([2,3,1,3,5])

In [None]:
# Calculamos el estimador de maxima verosimilitud usando calculo simbólico 
f = t * sympy.exp(-t*x) # distribución exponencial 
j = np.prod([f.subs(x,i) for i in r]) # se sustituyen los datos en la función y se hace el producto
logj = sympy.expand_log(sympy.log(j))
that = sympy.solve(sympy.diff(logj,t),t)[0]
print('El estimador de maxima verosimilitud es:',that)

El estimador de maxima verosimilitud es: 5/14


**Ejemplo.** Sea $x_1,\dots,x_n$ una m.a $Poisson(\lambda)$
$$ f(x_i;\lambda) = e^{-\lambda}\frac{\lambda^{x_i}}{x_i !}, \quad i\in\{1,2,\dots,n\}$$
1. Encontrar EMV
2. ¿es insesgado?
3. ECM

**Inciso 1**

$$L(x_1\dots x_n;\theta) = \prod_{i=1}^{n} e^{-\theta}\frac{\theta^{x_i}}{x_i !} = \frac{e^{-n\theta}\theta^{\sum x_i}}{x_1!\dots x_n!}$$

$$\log{L(x_1\dots x_n;\theta)} = \log{e^{-n\theta}\theta^{\sum x_i}} - \log{x_1!\dots x_n!} = -n\theta + \sum x_i \log{\theta} - \sum \log{x_i!}$$
derivando $L(x_i;\theta)$ e igualando a cero
$$ \frac{dL(x_i;\theta)}{d\theta} = -n + \frac{\sum x_i}{\theta} = 0$$
así
$$ \frac{\sum x_i}{\theta} = n \rightarrow  \theta = \frac{\sum x_i}{n} \quad \text{entonces} \quad \hat{\theta} = \bar{x}$$

**Inciso 2**
$$ \mathbb{E}[\hat{\theta}] = \mathbb{E}\left[\frac{\sum x_i}{n}\right] = \frac{1}{n}\sum \mathbb{E}[x_i] = \frac{1}{n}\sum \theta = \frac{n\theta}{n} = \theta $$

**Inciso 3**
$$\begin{align*}ECM(\hat{\theta}) &= Var(\hat{\theta}) = Var\left(\frac{\sum x_i}{n} \right) = \frac{1}{n^2} \sum Var(x_i) \\ & = \frac{1}{n^2} \sum \theta = \frac{n\theta}{n^2} = \frac{\theta}{n} \end{align*}$$
disminuye a medida que aumenta la cantidad de datos.