# Estimador Máximo Verosímil

Ejemplo 1. Lanzamos una moneda 100 veces, sabiendo que se obtienen 55 soles. Encontrar el EMV para la probabilidad $p$ de obtener sol en un sólo lanzamiento.

Si $X$: el número de soles que se obtiene al lanzar una moneda, se tiene que $X\sim Bin(100,p)$, es decir

$$f(55 \text{soles};p) = \binom{100}{55}p^{55}(1-p)^{100-55}$$

In [3]:
from scipy.stats import binom
import numpy as np
import sympy # Para el calculo simbólico y algebraico
from sympy.abc import x # importa la variable simbólica x

In [9]:
# Vamos a definir a p como una variable simbólica positiva
p = sympy.symbols('p', positiva=True)
# Definimos f
f = p**55 * (1-p)**(100-55)
#Derivamos f con respecto a p
df = sympy.diff(f,p)
# Igualamos la derivada a cero y despejamos p
phat = sympy.solve(df,p)[1]
phat
 
#print(f'El estimador de máxima verosimilitud para p es: {phat}')
print("El estimador de máxima verosimilitud para p es", phat)

El estimador de máxima verosimilitud para p es 11/20


In [12]:
# Veamos otro ejemplo

# Simularemos una muestra de tamaño 100

r = binom.rvs(n=1, p=0.7, size=100)
r

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0,
       1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0,
       1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1,
       0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0,
       1, 1, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0])

In [None]:
f = p**x * (1-p)**(1-x)
J = np.prod([f.subs(x,i) for i in r]) # subs es de susbtituir la variable simbolica
logJ = sympy.expand_log(sympy.log(J))
phat = sympy.solve(sympy.diff(logJ,p),p)[0]
print("El estimador de máxima verosimilitud para p es", phat)
# Obtenemos un valor cercano a 0.7

El estimador de máxima verosimilitud para p es 17/25


In [None]:
Ejercicio: El tiempo de retardo para pacientes con enfermedad coronaria potencial se define como la duración entre el comienzo de un síntoma agudo cardiovascular y la llegada a la unidad de emergencia.

Se supone que el tiempo de retardo sigue una distribución exponencial con parámetro $\theta $.

Se registraron los tiempos de retardo (en minutos) en la clínica para los primeros 20 pacientes:

$$ 525, \ 719, \ 2880, \ 150, \ 30, \ 251, \ 45, \ 858, \ 15, \ 47, \ 90, \ 56, \ 68, \ 6, \ 189, \ 180, \ 60, \ 60, \ 294, \ 747 $$

- Encuentra un estimador por el método de momentos para la media de la distribución.
- Encuentra el valor del estimador con los datos dados.

**Ejercicio:** El tiempo de retardo para pacientes con enfermedad coronaria potencial se define como la duración entre el comienzo de un síntoma agudo cardiovascular y la llegada a la unidad de emergencia.

Se supone que el tiempo de retardo sigue una distribución exponencial con parámetro $\theta $.

Se registraron los tiempos de retardo (en minutos) en la clínica para los primeros 20 pacientes:

$$ 525, \ 719, \ 2880, \ 150, \ 30, \ 251, \ 45, \ 858, \ 15, \ 47, \ 90, \ 56, \ 68, \ 6, \ 189, \ 180, \ 60, \ 60, \ 294, \ 747 $$

- Encuentra un estimador por el **método de momentos** para la media de la distribución (exponencial).
  Rocordemos que si $X\sim Exp(\theta)$, entonces $\mathbb{E}[X]=\frac{1}{\theta}$
- (Python) Encuentra el valor del estimador con los datos dados.

**Ejercicio (Pyton)**. Suponga que la vida util de los focos de cierta marca, se modela mediante una distribución expoencial de parametro  θ  (desconocido). Probamos 5 focos y encontramos que tienen una vida útil de  2,3,1,3  y  5  años, respectivamente. ¿Cuál es el MLE para  θ ?