# Estimador de máxima verossimilhança da distribuição exponencial
Neste notebook do Jupyter vamos demonstrar a dedução matemática do estimador de máxima verossimilhança do parâmetro da distribuição exponencial. Para ver os resultados dos comandos de cada etapa coloque o mouse ao lado esquerdo da célula que tem os comandos e clique em 'Run this cell'
## Preparação
Antes de começar importamos a biblioteca de matemática simbólica do Python. Ela permite criar expressões, como funções e suas derivadas, e manipulá-las simbolicamente.

In [None]:
from sympy import *
init_printing()

## A função de densidade probabilística
Para uma dada observação $x_i$ a função de densidade probabilística da distribuição exponecial é $\lambda e^{-\lambda x_i}$. Os comandos abaixo criam um objeto chamado `f` no Python, com a expressão simbólica dessa função matemática, para que possa ser manipulada:

In [None]:
## define os nomes dos símbolos que usaremos e como serão exibidos
x, L, i, n = symbols( 'x lambda i n' )
## Cria o objeto f com a expressão da densidade da exponencial
f = L*exp( -L*Indexed(x,i) )
## Exibe a expressão simbólica do objeto
f

## Defina a função de log-verossimilhança negativa
Agora podemos manipular matematicamente as expressão que criamos. Começamos usando-a para definir a função de log-verossimilhança negativa, que é a soma dos logarítimos dos valores da função acima sobre todos os valores dos dados ($x_i$). Primeiro aplicamos o logarítmo sobre função de densidade probabilística, e guardamos a expressão resultante no objeto `lf`

In [None]:
## Aplica o log 
lf = ln(f)
## Expande log de produtos em somas
lf = expand_log(lf, force=true)
## Exibe a expressão resultante
lf

e em seguida definimos a sua soma sobre todos os valores de $x_i$, que guardamos no objeto `LL'. Esta é a expressão da função de log-verossimilhança da distribuição de probabilidade exponencial:

In [None]:
LL = Sum(lf, (i,1,n))
LL=simplify(LL)
LL

Vamos fazer mais uma manipulação para tornar os próximos passos mais simples O somatório $\sum_{i=1}^n 1$ nada mais é que $n$. Substituímos isto na função obtida acima temos a expressão da função de log-verossimilhança em sau forma mais conhecida. Guardamos essa expressão no objeto `LL` :

In [None]:
g = Sum(1, (i,1,n))
LL = LL.subs(g,n)      
LL

## Estimativa de máxima verossimilhança (mle)
O MLE é  o valor do parâmetro $\lambda$ que maximiza a função de log-verossimilhança (ou minimiza a de log-verossimilhança negativa). Sabemos que as funções têm derivadas zero em seus pontos máximos e mínimos.
Então o truque para achar a expressão do mle é encontrar a expressão para o valor de $\lambda$
que faz a derivada da função de log-verossimilhança ser igual a zero. São duas etapas:

### Calcule a derivada da função de log-verossimlhança em relação ao parâmetro


Usamos o comando `diff` aplicado ao objeto `LL` para obter a derivada da log-verossimilhança em função do parâmetro $\lambda$:

In [None]:
## Derivada da função LL em relação a lambda
dLL = diff(LL,L)
## Simplifica a expressão
dLL = simplify( expand(dLL) )
## Exibe o resultado
dLL

### Resolvemos a derivada para o parâmetro
Agora igualamos a derivada da função de log-verossimilhança a zero e resolvemos esta equação para o parâmetro $\lambda$. Essa operção simbólica é feita com o comando `solve`, aplicado ao objeto `dLL` , em que guardamos a derivada da função de log-verossimilhança:

In [None]:
solve(dLL,L)

Ou seja, a estimativa de máxima verossimilhança do único parâmetro da distribuição ($\lambda$) exponencial é o inverso da média amostral.