# **VEROSIMILITUD MÁXIMA**

La ``verosimilitud máxima`` es una medida de la probabilidad de que un modelo genere los datos observados. La verosimilitud máxima es un método para encontrar los parámetros de un modelo que mejor se ajustan a los datos observados. 

Es decir, la verosimilitud máxima es un método para ``encontrar los estimadores puntuales`` de los parámetros de un modelo. Es el método más utilizado para estimar los parámetros de un modelo.

---

La idea de encontrar la verosimilitud máxima es con el fin de que los parametros se ``ajusten a nuestra distribución de probabilidad`` que instuimos que es la correcta según los datos observados.

> En el tema de las probabilidades hay muchos pasos detrás antes de llegar a la verosimilitud máxima:
>
>>- **Recolectar datos**.
>>- **Organizar los datos**.
>>- **Definir una distribución de probabilidad**. (Normal, Poisson, Binomial, etc.)
>>- **Definir los estimadores puntuales**. (Media, mediana, moda, etc.)
>>  - **Estimación por el método de máxima verosimilitud**.
>

No debemos olvidar que la ``verosimilitud máxima`` tambíen es capaz de encontrar la ``probabilidad estimada`` de los datos observados, solamente en el caso de una ``distribución discreta``. Siendo la probabilidad estimada un ``estimador puntual``.

---

## **FUNCIONES DE VEROSIMILITUD**

La función de verosimilitud es una función que nos permite ``encontrar los estimadores puntuales`` de los parámetros de un modelo.

> **Existen dos tipos de funciones de verosimilitud:**
>
>> - ``Producto de las probabilidades:`` $L(\theta) = \prod_{i=1}^{n} f(x_i|\theta)$
>>
>>Donde:
>>
>>- $L(\theta)$: Es la función de verosimilitud.
>>- $\theta$: Es el parámetro del modelo.
>>- $f(x_i|\theta)$: Es la función de densidad de probabilidad o función de masa de probabilidad.
>>- $x_i$: Es el dato observado.
>
>>- ``Logaritmo de la función de verosimilitud:`` $l(\theta) = \sum_{i=1}^{n} \log f(x_i|\theta)$
>>
>>Donde:
>>
>>- $l(\theta)$: Es el logaritmo de la función de verosimilitud.
>>- $\theta$: Es el parámetro del modelo.
>>- $f(x_i|\theta)$: Es la función de densidad de probabilidad o función de masa de probabilidad.
>>- $x_i$: Es el dato observado.

#### **DIFFERENCIA ENTRE LA FUNCIÓN DE VEROSIMILITUD Y EL LOGARITMO DE LA FUNCIÓN DE VEROSIMILITUD**

La ``diferencia`` entre la ``función de verosimilitud`` y el ``logaritmo de la función de verosimilitud`` es que la función de verosimilitud es ``muy difícil de maximizar`` y el logaritmo de la función de verosimilitud es ``muy fácil de maximizar``.

- La ``función de verosimilitud`` por producto de probabilidades es muy ``difícil de maximizar`` porque la multiplicación de muchos números pequeños puede dar como resultado un número muy pequeño, por lo que es muy difícil de maximizar.

- El ``logaritmo de la función de verosimilitud`` es muy ``fácil de maximizar`` porque el logaritmo de un número es la suma de los logaritmos de sus factores, por lo que es muy fácil de maximizar.

---

## **MÉTODO DE MÁXIMA VEROSIMILITUD**

El método de máxima verosimilitud es ``máximizar las funciones de verosimilitud ``para encontrar los estimadores puntuales más ``probables`` de los parámetros del modelo.

> **Existen dos tipos de métodos de máxima verosimilitud:**
>
>> - ``Método de máxima verosimilitud por producto de probabilidades:`` $\hat{\theta} = \underset{\theta}{\operatorname{argmax}} L(\theta)$
>
>>- ``Método de máxima verosimilitud por logaritmo de la función de verosimilitud:`` $\hat{\theta} = \underset{\theta}{\operatorname{argmax}} l(\theta)$
>
>>Donde:
>>
>>- $\hat{\theta}$: Es el estimador puntual del parámetro del modelo.
>>- $\theta$: Es el parámetro del modelo.
>>- $L(\theta)$: Es la función de verosimilitud.
>>- $l(\theta)$: Es el logaritmo de la función de verosimilitud.











---

### **EJEMPLO**

Considere una muestra aleatoria de tamaño ``n = 10``. En la práctica, la encuesta es aplicada a ``10 chilenos mayores de 18 años``.

Por lo cual, existe un conjunto de 10 variables aleatorias ``$X_1, X_2, ..., X_{10}$``. Cada una de estas variables aleatorias ``$X_i$`` son ``independientes``. Es decir, no hay relación entre ellas y ninguna depende de las otras.

- El ``parámetro θ`` es la proporción de chilenos que respalda la reforma.
    - La ``variable de interés X`` es el “respaldo a la reforma tributaria”. Esta variable toma el ``valor uno (1)`` si la reforma es respaldada y ``cero (0)`` si no.`

Por lo tanto, utilizamos la distribución de Bernoulli, dado que son variables independientes y solo toman dos valores.

> **Distribución de Bernoulli:**
>
>> **$P(X=k) = p^k(1-p)^{1-k}$**
>>
>> **Siendo:**
>> - $k$: Es el valor de la variable aleatoria.
>> - $p$: Es la probabilidad de éxito.
>> - $P(X=k)$: Es la probabilidad de que la variable aleatoria tome el valor $k$.

La variable aleatoria **($k$)** puede tomar los valores ``0`` o ``1``. 



In [24]:
import numpy as np 
import matplotlib.pyplot as plt
from scipy.optimize import optimize


# Distribucion de bernoulli
def bernoulli_pmf(x, p):
    return p**x * (1-p)**(1-x)

# o tambien puede ser:
# def bernoulli(x, p):
#    f_bernoulli = 1
#    for i in range(len(x)):
#        f_bernoulli *= p**x[i] * (1-p)**(1-x[i])
#    return f_bernoulli

# Función de verosimilitud por producto para bernoulli

def verosimilitud_bernoulli(x, p):
    v_bernoulli = 1 # Inicializar en 1
    for i in range(len(x)):
        v_bernoulli *= bernoulli_pmf(x[i], p)
    return v_bernoulli

# Ahora utilizamos el logaritmo para rendirmiento de la verosimilitud

def log_verosimilitud_bernoulli(p, x):
    log_v_bernoulli = 0 # Inicializar en 0
    for i in range(len(x)):
        log_v_bernoulli = np.sum(bernoulli_pmf(x[i], p))
    return log_v_bernoulli

if __name__ == "__main__":
    # Generar muestra aleatoria de 10 datos 0 o 1
    x = np.random.randint(2, size=10) # 2 es el numero de posibles valores
    print("Muestra de datos: ", x)

    # Si no sabemos la información de la muestra, podemos utilizar 0.5 como intuicion
    # En el caso de que sepamos y por ejemplo hayan 4 exitos y 6 fracasos, entonces 0.4 es la probabilidad
    p = 0.5 # Valor inicial de p

    # Utilizar la funcion de verosimilitud
    v_bernoulli = verosimilitud_bernoulli(x, p)
    print("Verosimilitud de bernoulli: ", v_bernoulli)

    # Utilizar la funcion de logaritmo de verosimilitud
    log_v_bernoulli = log_verosimilitud_bernoulli(p, x)
    print("Logaritmo de verosimilitud de bernoulli: ", log_v_bernoulli)




Muestra de datos:  [0 1 0 0 1 1 1 1 1 0]
Verosimilitud de bernoulli:  0.0009765625
Logaritmo de verosimilitud de bernoulli:  0.5
