# Il teorema di Bayes: un'applicazione pratica

Ricordiamo la formulazione del [**teorema di Bayes**](https://it.wikipedia.org/wiki/Teorema_di_Bayes= e vediamone a un caso pratico (ispirato da Michael Strevens, [Notes on Bayesian Confirmation Theory](https://www.strevens.org/bct/BCT.pdf)(2017)):
\begin{align}
P(h \mid e) = \dfrac{P(e \mid h)P(h)}{P(e)}
\end{align}

Ora immaginiamo di avere tre ipotesi in competizione tra loro, e di non avere ancora alcuno tipo di riscontro empirico:

* $h_1$ = tutti i corvi sono neri

* $h_2$ = metà dei corvi è nera

* $h_3$ = nessun corvo è nero

Dato che non ho ancora raccolto alcuna evidenza, assegno alle tre ipotesi la stessa probabilità a priori:
$P(h_1)=P(h_2)=P(h_3) = \dfrac{1}{3}$

## 1. Osservo un corvo nero
Al tempo $t_1$ osservo un corvo nero. Come cambiano le mie credenze nelle tre ipotesi? Cioè, applicando il teorema di Bayes, quale sarà la probabilità $P(h|e)$ dato $e=\ ho \ osservato\ un\ corvo \ nero$ per ognuna di $h_1, h_2, h_3$?

Iniziamo osservando che:
* $P(e\mid h_1) = 1.0$ -  la probabilità di osservare un corvo nero dato che so che tutti i corvi sono neri
* $P(e\mid h_2) = 0.5$ -  la probabilità di osservare un corvo nero dato che so che che metà dei corvi sono neri
* $P(e \mid h_3) = 0.0$ -  la probabilità di osservare un corvo nero dato che so che che nessun corvo è nero

A questo punto per applicare il teorema di Bayes mi manca solo il denominatore, cioè $P(e)$, la probabilità di osservare un corvo nero. Per calcolare $P(e)$ posso applicare il [teorema della probabilità totale](https://it.wikipedia.org/wiki/Teorema_della_probabilit%C3%A0_totale):
\begin{align}
P(e) &= P(e \mid h_1)P(h_1) + P(e \mid h_2)P(h_2) + P(e \mid h_3)P(h_3)\\&= 1 \times \frac{1}{3} + \frac{1}{2} \times \frac{1}{3} + 0 \times \frac{1}{3}\\&= \frac{1}{2}
\end{align}
Di conseguenza, dopo aver osservato un corvo avrò:
* $P(h_1\mid e) = \dfrac{1 \times \dfrac{1}{3}}{\dfrac{1}{2}}=\dfrac{2}{3}$
* $P(h_2\mid e) = \dfrac{\dfrac{1}{2} \times \dfrac{1}{3}}{\dfrac{1}{2}}=\dfrac{1}{3}$
* $P(h_3\mid e) = \dfrac{0\times \dfrac{1}{3}}{\dfrac{1}{2}}=0$


La probabilità della prima ipotesi $h_1$, che tutti i corvi siano neri, è raddoppiata, passando da 1/3 a 2/3; quella dell'ipotesi che metà dei corvi siano neri, $h_2$, è rimasta immutata; mentre la probabilità dell'ipotesi $h_3$, che nessun corvo sia nero è ora  pari a 0 (come intuitivamente ci aspettiamo che sia), e possiamo di conseguenza scartare tale ipotesi.

## 2. Osservo un secondo corvo nero
Cosa succede se a questo punto osservo un secondo corvo nero?
Per prima cosa dovrò calcolare qual è $P(e)$ a questo stadio utilizzando di nuovo il teorema della probabilità totale:
\begin{align}
P(e) &= P(e \mid h_1)P(h_1) + P(e \mid h_2)P(h_2)\\&= 1 \times \frac{2}{3} + \frac{1}{2} \times \frac{1}{3}\\&= \frac{5}{6}
\end{align}
E, applicando nuovamente il teorema di Bayes, avrò:

* $P(h_1\mid e) = \dfrac{1 \times \dfrac{2}{3}}{\dfrac{5}{6}}=\dfrac{4}{5}$
* $P(h_2\mid e) = \dfrac{\dfrac{1}{2} \times \dfrac{1}{3}}{\dfrac{5}{6}}=\dfrac{1}{5}$

1. Se un’ipotesi è logicamente incoerente con l’evidenza, dopo la condizionalizzazione la sua probabilità va a zero.
2.	Una volta che la probabilità di un’ipotesi scende a zero, non può mai risalire. L’ipotesi viene eliminata.
3.	L’ipotesi che assegna la più alta probabilità all’evidenza osservata (h1 nell’esempio) riceve il maggior incremento di probabilità dall’osservazione dell’evidenza. Un’ipotesi che assegna probabilità uno all’evidenza riceverà il massimo incremento possibile nelle circostanze.
4.	Se un’ipotesi è coerente con l’evidenza, la sua probabilità non può mai scendere a zero, anche se può avvicinarsi a zero quanto si desidera (come accadrebbe alla probabilità di h2 se venissero osservati solo corvi neri).
5.	Dopo la condizionalizzazione, le tue probabilità soggettive per un insieme di ipotesi mutuamente esclusive ed esaustive (come h1, h2 e h3) si sommeranno sempre a uno.
6.	Man mano che un’ipotesi diventa dominante, nel senso che la sua probabilità si avvicina a uno, il suo incremento di probabilità derivante da ulteriori predizioni di successo diminuisce (anche se c’è sempre un incremento).

In [248]:
import numpy as np
import matplotlib.pyplot as plt
from ipywidgets import interact, IntSlider
%matplotlib inline

def update_probabilities(hypotheses, num_observations):
    probabilities = np.ones(3) / 3  # Initial equal probabilities
    probability_history = [probabilities.copy()]
    c_e_history = [0.5]  # Initial C(e)
    
    for _ in range(num_observations):
        c_e = np.sum(hypotheses * probabilities)
        probabilities = hypotheses * probabilities / c_e
        probability_history.append(probabilities.copy())
        c_e_history.append(c_e)
    
    return np.array(probability_history), np.array(c_e_history)

def plot_probabilities(num_observations):
    hypotheses = np.array([1.0, 0.5, 0.0])  # h1, h2, h3
    prob_history, c_e_history = update_probabilities(hypotheses, num_observations)
    
    fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(10, 12))
    
    # Plot probabilities
    ax1.plot(prob_history[:, 0], label='h1 (tutti neri)', marker='o')
    ax1.plot(prob_history[:, 1], label='h2 (metà neri)', marker='s')
    ax1.plot(prob_history[:, 2], label='h3 (zero neri)', marker='^')
    # ax1.set_xlabel('Numero di corvi neri osservati')
    ax1.set_ylabel('Probabilità')
    ax1.set_title('Evoluzione della probabilità delle ipotesi')
    ax1.legend()
    ax1.grid(False)

    # Plot C(e)
    ax2.plot(c_e_history, label='C(e)', marker='o', color='purple')
    ax2.set_xlabel('Numero di corvi neri osservati')
    ax2.set_ylabel('C(e)')
    ax2.set_title('Evoluzione di C(e)')
    ax2.legend()
    ax2.grid(False)
    
    plt.tight_layout()
    plt.show()
    
    # Print final probabilities and next raven prediction
    print(f"\nProbabilità dopo {num_observations} osservazioni:")
    print(f"h1 (tutti neri): {prob_history[-1, 0]:.6f}")
    print(f"h2 (metà neri): {prob_history[-1, 1]:.6f}")
    print(f"h3 (nessuno nero): {prob_history[-1, 2]:.6f}")
    
    next_raven_black_prob = np.sum(hypotheses * prob_history[-1])
    print(f"\nCredenza che il prossimo corvo sarà nero: {next_raven_black_prob:.6f}")

# Create interactive widget
interact(plot_probabilities, num_observations=IntSlider(min=0, max=20, step=1, value=4, description='Corvi neri:'));

interactive(children=(IntSlider(value=4, description='Corvi neri:', max=20), Output()), _dom_classes=('widget-…