# Lezione 10 - Stima di parametri con maximum likelihood

## Stima di parametri
- Spesso l'obiettivo di un esperimento è quello di stimare i parametri di un modello
- Per farlo si utilizzano gli stimatori, che sono statistiche, cioé funzioni del campione
- Le stime prodotte da uno stimatore sono random variables, perché gli stimatori sono funzioni di numeri casuali (IID). Di conseguenza, gli stimatori hanno una propria PDF, che asintoticamente, cioé per $ N \to +\infty $, è una gaussiana

Vedremo essenzialmente due metodi per la stima di parametri:
- Metodo della maximum likelihood
- Fit con minimi quadrati usando la libreria `iminuit`

## Maximum likelihood
La tecnica della maximum likelihood si basa sull'assunzione che il valore cercato per la stima del parametro corrisponda al valore che massimizza la funzione di likelihood, definita da

$$ \mathcal{L}(\theta) = \mathcal{L}(\theta, \underline{x}) = f(x_{1}, \theta) \times \ldots \times f(x_{N}, \theta) = \prod_{i = 1}^{N}{f(x_{i}, \theta)} $$

Si cerca quindi il massimo della likelihood

$$ \frac{\partial \mathcal{L}(\theta)}{\partial \theta} = 0 $$

Secondo considerazioni analoghe a quelle della lezione precedente, si preferisce determinare il massimo della loglikelihood

$$ \frac{\partial \mathcal{l}(\theta)}{\partial \theta} = \frac{\partial \log{\left(\prod_{i = 1}^{N}{f(x_{i}, \theta)}\right)}}{\partial \theta} = \sum_{i = 1}^{N}{\frac{\partial \log{\left(f(x_{i}, \theta)\right)}}{\partial \theta}} $$

## Incertezza sulla stima del parametro
L'incertezza sulla stima di un parametro $ \hat{\theta}_{ML} $ determinato tramite maximum likelihood può essere determinata attraverso un metodo grafico:
- Si disegna $ \mathcal{l}(\theta) $
- Si determinano i punti di intersezione tra $ \mathcal{l}(\theta) $ e $ y = \mathcal{l}(\hat{\theta}_{ML}) - \frac{1}{2}$, le cui ascisse saranno $ \hat{\theta}_{1} = \hat{\theta}_{ML} - \hat{\sigma}_{ML} $ e $ \hat{\theta}_{2} = \hat{\theta}_{ML} + \hat{\sigma}_{ML} $
- Si ha che $ \hat{\sigma}_{ML} = \frac{1}{2} (\hat{\theta}_{2} - \hat{\theta}_{1}) $

Questo si può ricavare sviluppando con Taylor al secondo ordine la loglikelihood attorno al suo massimo. In modo analogo si possono calcolare gli zeri della funzione

$$ \mathcal{h}(\theta) = \mathcal{l}(\theta) - \mathcal{l}(\hat{\theta}_{ML}) + \frac{1}{2} $$

Come si può osservare dall'immagine seguente, con l'aumentare del numero di eventi, l'incertezza sulla stima del parametro diminuisce, dal momento che la loglikelihood diventa più stretta. Asintoticamente la loglikelihood è simmetrica rispetto al suo massimo ed è parabolica (rispecchia il fatto che la PDF dello stimatore è asintoticamente una gaussiana)

<div align="center">
<img src="Pictures/loglikelihood_profile.png" alt="loglikelihood">
</div>

## Proprietà degli stimatori ML
Gli stimatori maximum likelihood godono delle seguenti proprietà:
- Sono consistenti
- Sono asintoticamente non distorti (unbiased)
- Sono asintoticamente efficienti

## Distribuzione di probabilità di uno stimatore
La distribuzione di probabilità di uno stimatore può essere ricostruita utilizzando la tecnica dei toy experiment:
- Per ciascuno dei toy experiment si determina la stima del parametro cercata con il metodo di maximum likelihood
- Si raccolgono le stime in una lista
- Si genera un istogramma a partire dalle stime raccolte