In [2]:
from IPython.display import display, Markdown
import numpy as np

notti_di_pioggia = 40
giorni_meteo = 365

Ci alziamo una mattina di sole e scopriamo che il tratto di strada visibile dalla nostra finestra è bagnato, ma il giorno passato non ha piovuto. Quante probabilità ci sono che abbia piovuto mentre dormivamo la scorsa notte?

Per rispondere a questa domanda possiamo affidarci alla _statistica inferenziale bayesiana_ il cui scopo è determinare, con teoremi e formule più o meno complesse, di rispondere a domande simili a questa nei campi più disparati.

La categoria di "domanda" che abbiamo posto è chiamata probabilità **a posteriori** o **condizionata**: ci chiediamo infatti quale sia la probabilità dell'evento "pioggia la scorsa notte" (che chiameremo parametro $\theta$) condizionata dal, ovvero a posteriori del, fatto noto "tratto di strada bagnato" (che chiameremo variabile $X$). Scriveremo 

$$
P(\theta|X) = \; ?
$$

e leggeremo "probabilità di $\theta$ dato $X$". Il parametro $\theta$ rappresenta la _verità_ che non conosciamo e che vogliamo scoprire (ha piovuto la scorsa notte?) e la variabile $X$ ciò che abbiamo osservato (la strada è bagnata).

Le probabilità vanno da 0 a 1, ovvero da 0% a 100%. Sarà questo pertanto il tipo di risultato che otterremo.

Analizzando il problema, ci renderemo facilmente conto del fatto che la risposta dipende da una serie di fattori. Vediamoli uno per uno:

1. che probabilità c'è che una strada si bagni se piove?
2. che probabilità c'è, in generale, che piova una sola notte?
3. che probabilità c'è, in generale, che una strada si bagni?

La domanda 1. è ancora una probabilità condizionata (o a posteriori) ma è l'opposto della domanda iniziale: ci chiediamo infatti che probabilità ha una strada di bagnarsi a condizione (o a posteriori del fatto) che piova. Senza entrare troppo nel dettaglio, possiamo facilmente stabilire che sia piuttosto elevata: per non bagnarsi dovrebbe essere "coperta", ma allora ci troveremmo di fronte ad esempio a un porticato e non più ad un tratto di strada, oppure dovrebbe essere un tratto molto ristretto ad esempio coperto da un'auto parcheggiata che poi si è spostata, ecc (vedremo più avanti che in realtà il tipo di "domanda" posta in questo caso non è esattamente uguale alla precedente).

In [8]:
x_given_theta = .99

display(Markdown(fr"""
Assegnamo pertanto a questa probabilità un valore prossimo al 100%, 
per esempio {x_given_theta*100:.0f}\%. 
La probabilità a posteriori della variabile $X$ (la strada è bagnata?)
dato lo specifico valore del parametro $\theta$ (ha piovuto) sarà

$$
P(X|\theta) = {x_given_theta*100:.2f}\%
$$
"""))


Assegnamo pertanto a questa probabilità un valore prossimo al 100%, 
per esempio 99\%. 
La probabilità a posteriori della variabile $X$ (la strada è bagnata?)
dato lo specifico valore del parametro $\theta$ (ha piovuto) sarà

$$
P(X|\theta) = 99.00\%
$$


che leggeremo "probabilità di $X$ dato $\theta$".

La domanda 2. è invece una probabilità non condizionata ovvero **a priori**: ci si chiede qual'è la probabilità a priori di una sola notte di pioggia. Per rispondere a questa domanda potremmo controllare gli archivi del servizio meteorologico del posto in cui viviamo e segnarci tutte le singoli notti di pioggia, diciamo, in un anno: saranno molto frequenti se viviamo, ad esempio, in Irlanda o Scozia ma molto meno se viviamo in Italia, dato che le condizioni climatiche portano più spesso a giornate intere di pioggia (magari consecutive). Supponiamo di scoprire che ci siano state 40 singole notti di pioggia nello scorso anno; la probabilità a priori della variabile pioggia $\theta$ sarà pertanto

In [7]:
theta_prior = notti_di_pioggia / giorni_meteo

display(Markdown(fr"""
$$
P(\theta) = {notti_di_pioggia} / {giorni_meteo} = {theta_prior*100:.2f}\%
$$
"""))


$$
P(\theta) = 40 / 365 = 10.96\%
$$


La domanda 3. è, come la precedente, una probabilità a priori ma più difficile da determinare. Perché? Ci chiediamo quale sia la probabilità a priori che una strada sia bagnata, dovremmo quindi tener conto di tutte le possibilità tali per cui una strada si bagni, dalle più probabili (la pioggia stessa, un camion delle pulizie stradali passato da poco ecc) alle più improbabili (il ribaltamento di un carretto di consegne di bottiglie di acqua con rottura di sufficienti bottiglie, l'esondazione di un canale di irrigazione abbastanza vicino, l'atterraggio di un'astronave aliena che usi acqua come propellente... ecc). Sembra quasi impossibile da determinare, ma esiste un metodo che può venirci in aiuto: possiamo semplicemente sommare tra loro

In [9]:
display(Markdown(fr"""
- la probabilità che una strada si bagni se piove, che abbiamo già stabilito infatti
$P(X|\theta) = {x_given_theta*100:.2f}\%$, 
moltiplicato per la probabilità che piova una notte, che conosciamo già 
$P(\theta) = {theta_prior*100:.2f}$\%
- la probabilità che una strada si bagni se non piove  $P(X|\overline{{\theta}})$, 
che leggeremo "probabilità di $X$ dato non $\theta$"
moltiplicato per la probabilità che non piova solo una notte $P(\overline{{\theta}})$, che leggeremo
"probabilità di non $\theta$"
"""))


- la probabilità che una strada si bagni se piove, che abbiamo già stabilito infatti
$P(X|\theta) = 99.00\%$, 
moltiplicato per la probabilità che piova una notte, che conosciamo già 
$P(\theta) = 10.96$\%
- la probabilità che una strada si bagni se non piove  $P(X|\overline{\theta})$, 
che leggeremo "probabilità di $X$ dato non $\theta$"
moltiplicato per la probabilità che non piova solo una notte $P(\overline{\theta})$, che leggeremo
"probabilità di non $\theta$"


del primo termine conosciamo già tutto, ma come facciamo a determinare i valori del secondo termine? Grazie alle regole delle probabilità, la probabilità "non piova una sola notte" è complementare alla probabilità che "piova una sola notte", di cui abbiamo già stabilito il valore:

In [10]:
display(Markdown(fr"""
$$
P(\overline{{\theta}}) = 1 - P(\theta) = 1 - {(theta_prior)*100:.2f} \% = 
{(1-theta_prior)*100:.2f}\%
$$
"""))


$$
P(\overline{\theta}) = 1 - P(\theta) = 1 - 10.96 \% = 
89.04\%
$$


Ci serve dunque assegnare un valore a $P(X|\overline{\theta})$. Osserviamo che, per le regole delle probabilità

$$
P(X|\overline{\theta}) = 1 - P(\overline{X}|\overline{\theta})
$$

ovvero: la probabilità che una strada _si bagni se non piove_ è complementare alla probabilità che _non si bagni se non piove_ che corrisponde alla probabilità che una strada sia asciutta se non piove.

In [12]:
non_x_given_non_theta = .97

display(Markdown(fr"""
In questo caso specifico possiamo solo assegnare un valore arbitrario a 
$P(\overline{{X}}|\overline{{\theta}})$ risparmiandoci solamente il compito di 
immaginare le situazioni più improbabili (come l'astronave aliena) 
e considerando che "è molto probabile" che una strada sia asciutta in assenza di pioggia,
ad esempio {non_x_given_non_theta*100:.0f}\%:

$$
P(X|\overline{{\theta}}) = 1 - P(\overline{{X}}|\overline{{\theta}}) = 
1 - {non_x_given_non_theta*100:.2f}\% = {(1-non_x_given_non_theta)*100:.2f}\%
$$
"""))


In questo caso specifico possiamo solo assegnare un valore arbitrario a 
$P(\overline{X}|\overline{\theta})$ risparmiandoci solamente il compito di 
immaginare le situazioni più improbabili (come l'astronave aliena) 
e considerando che "è molto probabile" che una strada sia asciutta in assenza di pioggia,
ad esempio 97\%:

$$
P(X|\overline{\theta}) = 1 - P(\overline{X}|\overline{\theta}) = 
1 - 97.00\% = 3.00\%
$$


in altre situazioni invece è un valore noto (come nel caso dei test diagnostici in campo medico che vedremo in seguito).

In [13]:
x_prior = x_given_theta * theta_prior + (1-non_x_given_non_theta) * (1-theta_prior)

display(Markdown(fr"""
Possiamo pertanto determinare che la probabilità a priori che una strada sia bagnata è pari al

$$
P(X) = P(X|\theta)P(\theta) + P(X|\overline{{\theta}})P(\overline{{\theta}}) = 
{x_given_theta*100:.2f}\% \cdot {theta_prior*100:.2f}\% + 
{(1-non_x_given_non_theta)*100:.2f}\% \cdot {(1-theta_prior)*100:.2f}\% =
{x_prior*100:.2f}\%
$$
"""))


Possiamo pertanto determinare che la probabilità a priori che una strada sia bagnata è pari al

$$
P(X) = P(X|\theta)P(\theta) + P(X|\overline{\theta})P(\overline{\theta}) = 
99.00\% \cdot 10.96\% + 
3.00\% \cdot 89.04\% =
13.52\%
$$


Questa operazione appena effettuata 

$$
P(X) = \sum_{i} \Big( P(X|\theta_i)P(\theta_i) \Big)
$$

è detta _marginalizzazione della variabile $X$_ e, per questo motivo, la "domanda" 3. è chiamata _probabilità marginale_.

Arrivati a questo punto chiediamoci: quale relazione hanno le tre probabilità determinate con la probabilità che vogliamo ottenere $P(\theta|X)$?.

Possiamo dire che

- la probabilità che una strada sia bagnata se ha piovuto $P(X|\theta)$ e la probabilità che piova una notte sola $P(\theta)$ sono direttamente proporzionali alla probabilità che abbia piovuto la scorsa notte data la strada bagnata: entrambe queste probabilità contribuiscono in modo positivo alla risposta che cerchiamo
- la probabilità che una strada sia bagnata in generale $P(X)$ è inversamente proporzionale alla probabilità che abbia piovuto la scorsa notte se la strada è bagnata: ci potrebbero essere una serie di altri motivi per cui la strada sia bagnata e noi vogliamo solo quelli direttamente collegati alla pioggia

riassumendo

$$
P(\theta|X) = \frac{P(X|\theta)P(\theta)}{P(X)}
$$

l'equazione appena scritta è il _Teorema di Bayes_.

Assegnamo ai termini del teorema i valori ricavati in precedenza e calcoliamo

In [14]:
theta_given_x = x_given_theta*theta_prior/x_prior

display(Markdown(fr"""
$$
P(\theta|X) = \frac{{P(X|\theta)P(\theta)}}{{P(X)}} = 
\frac{{ {x_given_theta*100:.2f}\% \cdot {theta_prior*100:.2f}\% }}{{ {x_prior*100:.2f}\% }} = 
{theta_given_x*100:.2f}\%
$$

Siamo giunti pertanto a determinare, grazie alle regole delle probabilità e al
Teorema di Bayes, che la probabilità che la scorsa notte abbia piovuto
dato il fatto che vediamo un tratto di strada bagnata è pari al {theta_given_x*100:.2f}\%.
"""))


$$
P(\theta|X) = \frac{P(X|\theta)P(\theta)}{P(X)} = 
\frac{ 99.00\% \cdot 10.96\% }{ 13.52\% } = 
80.24\%
$$

Siamo giunti pertanto a determinare, grazie alle regole delle probabilità e al
Teorema di Bayes, che la probabilità che la scorsa notte abbia piovuto
dato il fatto che vediamo un tratto di strada bagnata è pari al 80.24\%.


***

Nel caso specifico appena trattato, la risposta sembra piuttosto ovvia e vano l'intero sforzo per arrivare al risultato, ma in altre situazioni il calcolo bayesiano della probabilità a posteriori può dare responsi anche molto lontani da quelli che ci suggerirebbe il semplice intuito.

In [16]:
PR = .00002
SE = .85
SP = .99
PR10 = 10**np.ceil(abs(np.log10(PR)))

display(Markdown(fr"""
Supponiamo ad esempio che un paziente venga sottoposto ad un test di screening 
per una malattia $M$ piuttosto rara, ad esempio con una prevalenza $\mathbf{{PV}}$ nella popolazione 
di appartenenza dello {PR*100:.3f}\%, ovvero {PR*PR10:.0f} casi su {PR10:,.0f}.

Il test cui verrà sottoposto è di tipo qualitativo e fornirà un responso dicotomico: 
positivo $\oplus$ oppure negativo $\ominus$.
Sappiamo, dalla letteratura medica che abbiamo consultato, che il test ha sensibilità $\mathbf{{SE}}$
{SE:.0%} e specificità $\mathbf{{SP}}$ {SP:.0%} (per approfondimenti, si veda [Link]()).

Dal punto di vista della statistica bayesiana sensibilità e specificità sono due probabilità a posteriori, rispettivamente:

$$
\mathbf{{SE}} = P(\oplus|M) = {SE*100:.2f}\%
$$

$$
\mathbf{{SP}} = P(\ominus|\overline{{M}}) = {SP*100:.2f}\%
$$
"""))


Supponiamo ad esempio che un paziente venga sottoposto ad un test di screening 
per una malattia $M$ piuttosto rara, ad esempio con una prevalenza $\mathbf{PV}$ nella popolazione 
di appartenenza dello 0.002\%, ovvero 2 casi su 100,000.

Il test cui verrà sottoposto è di tipo qualitativo e fornirà un responso dicotomico: 
positivo $\oplus$ oppure negativo $\ominus$.
Sappiamo, dalla letteratura medica che abbiamo consultato, che il test ha sensibilità $\mathbf{SE}$
85% e specificità $\mathbf{SP}$ 99% (per approfondimenti, si veda [Link]()).

Dal punto di vista della statistica bayesiana sensibilità e specificità sono due probabilità a posteriori, rispettivamente:

$$
\mathbf{SE} = P(\oplus|M) = 85.00\%
$$

$$
\mathbf{SP} = P(\ominus|\overline{M}) = 99.00\%
$$


ovvero la probabilità a posteriori di ottenere un test positivo se si è malati e la probabilità a posteriori di ottenere un test negativo se non si è affetti dalla relativa patologia.

La prevalenza $\mathbf{PV}$ della malattia in questione invece è, in questo caso, una probabilità a priori: dato che non abbiamo alcuna informazione sul paziente se non quella di appartenere alla popolazione scelta per lo screening, è la probabilità a priori che il paziente sia affetto dalla malattia $P(M)$.

Quello che vogliamo ottenere sottoponendo il paziente al test è la probabilità a posteriori dato il risultato $\odot$ del test

$$
P(M|\odot)
$$

dove la probabilità di malattia $M$ è il parametro $\theta$ (verità non nota) mentre il risultato $\odot$ del test è la variabile $X$.

Applicando quindi il Teorema di Bayes otteniamo che

$$
P(M|\odot) = \frac{P(\odot|M)P(M)}{P(\odot)}
$$

Supponiamo che il test sia risultato positivo $\oplus$, la nostra formula diventerà pertanto

$$
P(M|\oplus) = \frac{P(\oplus|M)P(M)}{P(\oplus)}
$$

Osserviamo che 

- $P(\oplus|M)$ altro non è che la sensibilità $\mathbf{SE}$ del test
- $P(M)$ è, come detto in precedenza, la prevalenza della malattia

Come determiniamo $P(\oplus)$ ovvero la probabilità a priori (probabilità _marginale_) di ottenere un test positivo?

Possiamo procedere _marginalizzando_ la variabile $\oplus$ come fatto in precedenza per la probabilità a priori di osservare una strada bagnata

In [17]:
PP = SE*PR + (1-SP)*(1-PR)

display(Markdown(fr"""
$$
P(\oplus) = P(\oplus|M)P(M) + P(\oplus|\overline{{M}})P(\overline{{M}})
$$

come prima, conosciamo il primo termine della somma (sensibilità e prevalenza) e
sappiamo che 

$$
P(\overline{{M}}) = 1 - P(M) = 1 - {PR*100:.3f}\% = {(1-PR)*100:.3f}\%
$$ 

ma, a differenza dell'esempio precedente, possiamo determinare con precisione il secondo termine coi dati a
disposizione infatti

$$
P(\oplus|\overline{{M}}) = 1 - P(\ominus|\overline{{M}}) = 1 - \mathbf{{SP}} =
1 - {SP*100:.2f}\% = {(1-SP)*100:.2f}\%
$$

Possiamo quindi ottenere

$$
P(\oplus) = P(\oplus|M)P(M) + P(\oplus|\overline{{M}})P(\overline{{M}}) = 
\mathbf{{SE}} \cdot \mathbf{{PV}} + (1 - \mathbf{{SP}}) (1 - \mathbf{{PV}}) = 
{SE*100:.2f}\% \cdot {PR*100:.3f}\% + {(1-SP)*100:.2f}\% \cdot {(1-PR)*100:.3f}\% = 
{PP*100:.3f}\%
$$
"""))


$$
P(\oplus) = P(\oplus|M)P(M) + P(\oplus|\overline{M})P(\overline{M})
$$

come prima, conosciamo il primo termine della somma (sensibilità e prevalenza) e
sappiamo che 

$$
P(\overline{M}) = 1 - P(M) = 1 - 0.002\% = 99.998\%
$$ 

ma, a differenza dell'esempio precedente, possiamo determinare con precisione il secondo termine coi dati a
disposizione infatti

$$
P(\oplus|\overline{M}) = 1 - P(\ominus|\overline{M}) = 1 - \mathbf{SP} =
1 - 99.00\% = 1.00\%
$$

Possiamo quindi ottenere

$$
P(\oplus) = P(\oplus|M)P(M) + P(\oplus|\overline{M})P(\overline{M}) = 
\mathbf{SE} \cdot \mathbf{PV} + (1 - \mathbf{SP}) (1 - \mathbf{PV}) = 
85.00\% \cdot 0.002\% + 1.00\% \cdot 99.998\% = 
1.002\%
$$


Abbiamo perciò tutti i termini necessari a determinare la probabilità di malattia a posteriori dato il risultato positivo del test. Visto il valore molto elevato di sensibilità e specificità ci aspetteremmo di ottenere un risultato altrettanto notevole ma applicando il teorema di Bayes otteniamo

In [18]:
PO = SE*PR/PP

display(Markdown(fr"""
$$
P(M|\oplus) = \frac{{P(\oplus|M)P(M)}}{{P(\oplus)}} = 
\frac{{ {SE*100:.2f}\% \cdot {PR*100:.3f}\% }}{{ {PP*100:.3f}\% }} =
{PO*100:.2f}\%
$$

ovvero, in seguito a risultato positivo del test, il nostro paziente avrà
una probabilità a posteriori di essere malato pari soltanto al 
{PO*100:.2f}\%...!

Perché è così bassa nonostante sensibilità e specificità fossero piuttosto elevate? Il risultato
dipende dal fatto che 
siamo partiti con un'esigua probabilità di malattia a priori $\mathbf{{PV}}={PR*100:.3f}\%$.
"""))


$$
P(M|\oplus) = \frac{P(\oplus|M)P(M)}{P(\oplus)} = 
\frac{ 85.00\% \cdot 0.002\% }{ 1.002\% } =
0.17\%
$$

ovvero, in seguito a risultato positivo del test, il nostro paziente avrà
una probabilità a posteriori di essere malato pari soltanto al 
0.17\%...!

Perché è così bassa nonostante sensibilità e specificità fossero piuttosto elevate? Il risultato
dipende dal fatto che 
siamo partiti con un'esigua probabilità di malattia a priori $\mathbf{PV}=0.002\%$.


Questo esempio spiega più chiaramente in cosa consista l'analisi bayesiana:

> L'analisi bayesiana consiste nella rivalutazione del nostro iniziale livello di fiducia circa l'avverarsi di un evento $\theta$ in base all'osservazione di un dato $X$ ovvero nella *ridistribuzione* della probabilità *a priori* di un parametro $\theta$ condizionato dalla variabile $X$

Ripensando all'esempio precedente della strada, cosa abbiamo fatto in realtà? Abbiamo _ridistribuito_ la probabilità a priori circa le nostre convinzioni di una notte isolata di pioggia in base all'osservazione del tratto di strada bagnata. Se non avessimo osservato $X=$"strada bagnata" o se avessimo osservato qualcosa di differente (ad esempio, solo strisce bagnate sulla strada o dei lavori in corso sulla tubazioni, ecc) la probabilità a priori di pioggia la notte scorsa sarebbe stata modificata di conseguenza.

***

Ma come può il ragionamento seguito finora portare ad una stima di previsione riguardo la probabilità un determinato evento $\theta$ nel futuro?

Supponiamo che il parametro $\theta$ di cui vogliamo calcolare la probabilità sia $R_t$ ovvero il tasso di riproduzione effettivo $R$ nel tempo $t$ di COVID-19 in Italia e i valori della variabile $X$ osservata siano i nuovi casi giornalieri $k$ di COVID-19 osservati in Italia dal primo all'ultimo giorno dei dati registrati. 

I calcoli saranno più complessi visto che non ci stiamo più occupando di eventi dicotomici, come malattia o salute, strada bagnata o asciutta, notte di pioggia o non, risultato positivo o negativo, bensì una scala continua dei possibili valori di $R_t$ da un minimo di 0 ad un massimo da definire e una scala discreta di valori dei nuovi casi $k$ osservati da un minimo di 0 ad un massimo virtualmente illimitato, ma ciò di cui trattiamo sono comunque probabilità. Infatti, ciò che vogliamo ottenere è sempre $P(R_t|k)$ ovvero, a partire da un livello di fiducia a priori circa le probabilità di ottenere ogni possibile valore di $R_t$, ridistribuire per ogni giorno in archivio le probabilità dei valori di $R_t$ in base all'osservazione dei $k$ nuovi casi registrati. Usando la notazione ormai nota e il Teorema di Bayes:

$$
P(R_t|k) = \frac{P(k|R_t)P(R_t)}{P(k)}
$$

dove 

- $P(k|R_t)$ sono le probabilità a posteriori di osservare i nuovi casi $k$ per ciascuno dei possibili valori di $R_t$
- $P(R_t)$ sono le probabilità a priori per ogni valore possibile del numero di riproduzione effettivo
- $P(k)$ è la probabilità a priori (_marginale_) di osservare il numero di nuovi casi giornalieri misurato per ogni giorno in archivio

È più chiara ora la differenza tra la "domanda iniziale" $P(R_t|k)$ e il termine $P(k|R_t)$ del teorema di Bayes: nel primo caso infatti ci chiediamo per ciascun valore possibile di $R_t$ quale la sia la probabilità di ottenerlo data l'osservazione nota di $k$ nuovi casi; nel secondo invece ci si chiede quanto sia probabile osservare i $k$ nuovi casi effettivamente misurati per ognuno dei possibili valori di $R_t$.

La probabilità a posteriori di $R_t$ calcolata per ciascun giorno diventa la probabilità a priori per il giorno successivo, che verrà nuovamente ridistribuita in base ai nuovi casi giornalieri osservati, ecc... fino all'ultimo giorno (presumibilmente oggi).

Come si diceva, l'inferenza bayesiana consiste nella rivalutazione del livello di fiducia inziale (a priori) su un parametro $\theta$ data l'osservazione di un valore della variabile $X$, osserviamo perciò che il teorema di Bayes può essere riscritto così

$$
P(\theta|X) = P(\theta) \cdot \frac{P(X|\theta)}{P(X)}
$$

dove $P(\theta)$ è il grado di fiducia iniziale (probabilità a priori) dell'avverarsi di $\theta$ e il secondo termine rappresenta il coefficiente che determina "l'entità della rivalutazione"

$$
\frac{P(X|\theta)}{P(X)} = \mathscr{L}(\theta|X)
$$

che leggeremo **verosimiglianza** $\mathscr{L}$ (dall'inglese _Likelihood_) del parametro $\theta$ data l'osservazione di $X$.

Quindi possiamo dire che

$$
P(\theta|X) = P(\theta) \cdot \mathscr{L}(\theta|X)
$$

> La probabilità a posteriori di $\theta$ data l'osservazione di $X$ è direttamente proporzionale alla probabilità a priori di $\theta$ e alla verosimiglianza di $\theta$ dato $X$

Tornando all'esempio del numero di riproduzione effettivo possiamo pertanto dire che

$$
P(R_t|k) = P(R_t) \cdot \frac{P(k|R_t)}{P(k)}
$$

e che

$$
P(R_t|k) = P(R_t) \cdot \mathscr{L}(R_t|k)
$$

Supponiamo ora di essere giunti a determinare la probabilità a posteriori di $R_t$ dell'ultimo giorno $t=\omega$ in archivio (oggi) ovvero $R_\omega$. Non abbiamo più $k$ nuovi casi da osservare, come determiamo la probabilità dei valori di $R_t$ per il giorno successivo $t=\omega+1$ (domani) ovvero $R_{\omega+1}$?

***

**WIP**

***

Possiamo assumere come "nuova probabilità a priori" non più i casi osservati ma l'ultima probabilità di $R_t$ a posteriori calcolata $R_\omega$ e chiederci

$$
P(R_{\omega+1}|R_\omega) = \; ?
$$

per ogni possibile valore di $R_t$ qual'è sarà la probabilità di osservarlo domani in base alla calcolata probabilità odierna di $R_\omega$?

Applicando il teorema di Bayes otterremmo

$$
P(R_{\omega+1}|R_\omega) = P(R_{\omega+1}) \cdot \frac{ P(R_{\omega}|R_{\omega+1}) }{ P(R_{\omega}) }
$$

dove (attenzione!) $R_{\omega+1}$ è la probabilità a priori che verrà rivalutata ed è dunque, come in precedenza, pari a $P(R_t)$ mentre $P(R_\omega)$ è la probabilità odierna che conosciamo già determinata per i valori di $R_t$.

$$
P(R_{\omega+1}|R_\omega) = P(R_{t}) \cdot \frac{ P(R_{\omega}|R_{t}) }{ P(R_{\omega}) }
$$

come calcoliamo invece $P(R_{\omega}|R_{t})$?