# Creare un modello per capire la diffusione dei Virus (SARS-CoV-2)

##### Questo corso si basa su un modulo sviluppato da [Callysto](https://callysto.ca/callysto/) per il sistema educativo Canadese. [Future Education Modena](https://www.fem.digital/) sta lavorando ad un progetto simile per il sistema educativo Italiano. 
***
***
Siamo interessati a modellare l'epidemia del Coronavirus (SARS-CoV-2). Partiamo dal presupposto che la popolazione totale possa essere suddivisa in una serie di classi, ognuna delle quali dipende dallo stato dell'infezione. Il modello epidemiologico [**SIR Model**](https://en.wikipedia.org/wiki/Compartmental_models_in_epidemiology) è il più semplice e, come suggerisce il nome, divide la popolazione in tre classi. 


**Obiettivi Didattici:**
* Esaminare e visualizzare concetti ed esempi relativi alla diffusione del virus.
* Esaminare la linea del tempo/mappa del virus.
* Visualizzare il modello matematico che mostra il tasso di guarigione, di infezione e di rimozione.

## Il modello SIR
Il modello SIR è un modello matematico che aiuta a studiare la diffusione di una malattia infettiva mortale oppure immunizzante (cioè si può prendere una sola volta).

### Parametri della popolazione

In questo modello, la popolazione totale è divisa in tre gruppi:

* **S**uscettibili: individui che possono essere infettati ma che non lo sono ancora stati
* **I**nfetti: individui infetti
* **R**imossi: individui che sono morti o recuperati 

Le iniziali **S I R** attribuiscono al modello il nome SIR.

Essendo molto difficile creare un modello che perfettamente rappresenti la realtà, queste ipotesi sono necessarie:

1. Dimensione della popolazione costante (chiusa), N
2. Tassi costanti (ad es. trasmissione, tassi di rimozione)
3. Nessuna demografia (cioè, nascite e decessi)
4. Popolazione ben assortita

Stiamo esaminando i cambiamenti, nel corso di un'epidemia, del numero di questi individui, rappresentati da $S$, $I$ e $R$. In altre parole, vogliamo capire come, col passare del tempo, il numero di individui in ogni gruppo cambia. 

Avere un modello realistico potrebbe essere utile per prevedere l'esito a lungo termine di un'epidemia e informare gli interventi di salute pubblica, come sta accadendo in questi giorni in tutto il mondo.

Se possiamo prevedere che il numero di persone nel gruppo rimossi $R$ rimarrà basso e il numero di persone infette $I$ scenderà rapidamente a zero, allora non c'è bisogno di intervenire e possiamo lasciare che l'epidemia finisca da sola, fornendo solo assistenza medica alle persone infette

Al contrario, se prevediamo un forte aumento del numero di persone infette e rimosse, allora l'epidemia ha bisogno di un intervento rapido prima di provocare un gran numero di vittime. Per questo motivo, uno degli interventi più importanti da mettere in atto è quello di assicurarsi che non ci siano contatti tra le persone infette e quelle suscettibili.

Ora descriviamo il modello matematico SIR (Susceptible, Infected, Removed) di un'epidemia nel tempo (ad esempio ogni settimana). Scriviamo $S_t, I_t, R_t$ per indicare il numero di individui suscettibili, infetti e rimossi nel punto temporale $t$. $t=1$ è il primo punto temporale registrato, $t=2$ è il secondo e così via. Chiamiamo *unità temporale* il tempo trascorso tra due punti temporali, ad esempio un giorno o una settimana.

In questo modello, assumiamo che la **popolazione totale sia costante** (quindi le nascite e i decessi sono ignorati) per la durata della simulazione del modello. Rappresentiamo la dimensione totale della popolazione per $N$, e quindi in qualsiasi punto temporale $t$ abbiamo

$$N=S_t + I_t + R_t$$

***

### Modellare la progressione della malattia

Si presume che la trasmissione richieda il contatto tra un individuo infetto e un individuo sensibile. Supponiamo anche che la malattia richieda un tempo costante per progredire all'interno di un individuo infetto fino alla sua rimozione (morte o guarigione). Dobbiamo definire questi due processi (infezione e rimozione) e modellare il loro impatto sulla transizione dal momento in cui $t = (S_t,I_t,R_t,R_t)$ al successivo stato $t + 1 = (S_{t+1},I_{t+1},R_{t+1},R_{t+1})$.

![SIR1](./images/SIR1.png)

Le occorrenze di nuove infezioni di è modellato utilizzando un parametro $\beta$, che dà la proporzione di contatti tra le persone suscettibili e le persone infette, durante una unità di tempo, che si traduce in infezione. Possiamo quindi descrivere il numero di nuove persone infette come $\dfrac{\beta S_t I_t}{N}$ dove il termine $S_t I_t$ rappresenta l'insieme di tutti i possibili contatti tra persone suscettibili e persone infette. Discuteremo di questo termine più nel dattaglio più tardi.

Il verificarsi di rimozioni di persone infette è modellato utilizzando un parametro indicato da $\gamma$. Si definisce come proporzione di individui infetti che muoiono o si riprendono (passano da Infetti a Rimossi) tra due punti temporali. Se ci viene dato che la durata di un'infezione è $T$ (cioè quanti punti di tempo ci vogliono per un individuo tra l'infezione e la rimozione), allora $\gamma = \dfrac{1}{T}$.  

Perché $\gamma = \dfrac{1}{T}$ ? 
Ammettiamo, per esempio, che una malattia duri T = 3 giorni,<br/>
- il primo giorno guariscono $\gamma$ I pazienti,<br/>
- il secondo altri $\gamma$ I pazienti,<br/>
- il terzo giorno altri $\gamma$ I.<br/>

- I= $\gamma$ I + $\gamma$ I + $\gamma$ I . -----> 3$\gamma$  = 1 ------> $\gamma = \dfrac{1}{T}$


![SIR2](./images/SIR2.png)

Tenendo conto del tasso di contatto $\beta$ e del tasso di rimozione $\gamma$, allora ogni gruppo di popolazione cambia all'interno di una unità di tempo come segue

$$
\begin{align}
S_{t+1} &= S_t -  \dfrac{{\beta} S_t I_t}{N}\\
I_{t+1} &= I_t +  \dfrac{{\beta} S_t I_t}{N} - \gamma I_t \\
R_{t+1} &= R_t + \gamma I_t\\
N&=S_t + I_t + R_t
\end{align}
$$

Queste equazioni formano il modello SIR. Esse permettono, dalla conoscenza dei parametri del modello ($\beta$ e $\gamma$) e dello stato attuale ($S_t,I_t,R_t$) di una popolazione di prevedere i prossimi stati della popolazione per i punti temporali successivi. Tali modelli sono fondamentali ai nostri giorni per il monitoraggio e il controllo delle epidemie di malattie infettive.
***

##### Osservazioni tecniche.
In primo luogo, si noti che il modello SIR non impone che i valori $S_t,I_t,R_t$ in un dato punto temporale siano interi. Poiché $\beta$ e $\gamma$ sono in realtà numeri fluttuanti, questi valori sono in realtà il più delle volte non interi. Questo va bene perché il modello SIR è un modello approssimativo e mira soprattutto a prevedere la dinamica generale di un'epidemia, non i valori precisi per il numero di individui suscettibili, infetti e rimossi.

Successivamente, ci si può chiedere come trovare i valori dei parametri $\beta$ e $\gamma$ necessari per avere un modello SIR completo. 

Come discusso in precedenza, il parametro $\gamma$ è relativamente facile da trovare sapendo come la malattia progredisce in un paziente, poiché è per lo più l'inverso del tempo medio in cui un paziente è malato. 

Il parametro $\beta$ è meno facile da ottenere. Leggendo le equazioni possiamo vedere che durante un punto temporale, tra gli individui $S_t$ suscettibili, il numero che si infetta è $(\dfrac{{\beta}}{N}) S_t I_t$. Come già detto, il prodotto $S_t I_t$ può essere interpretato come l'insieme di tutti i possibili contatti tra gli individui $S_t$ suscettibili e gli individui $I_t$ infetti ed è spesso un numero elevato, molto più grande di $S_t$ e dell'ordine di $N^2$. La divisione per $N$ mira ad abbassare questo numero, soprattutto per normalizzarlo in base alla popolazione totale, per assicurarsi che sia in ordine di $N$ e non quadratico in $N$. Quindi, affinché il numero di nuovi individui infetti durante un'unità di tempo sia ragionevole, $\beta$ è generalmente un piccolo numero compreso tra $0$ e $1$. Ma formalmente, se scegliamo un valore per $\beta$ troppo grande, allora il modello SIR prevede un valore per $S_t$ che può essere negativo, il che non è coerente con il fenomeno modellato. Quindi scegliere il valore di $\beta$ è il passo cruciale nella modellazione di un'epidemia.

***

In [1]:
###################################################################################################
################################# NON MODIFICARE QUESTO CODICE ####################################
###################################################################################################
# Questa funzione prende come input un vettore y che contiene tutti i valori iniziali,
# t: il numero di punti di tempo (ad es. giorni)
# beta: proporzione di contatti che provocano infezioni
# gamma: proporzione di infetti che vengono rimossi
# S1,I1,R1 = dimensioni iniziali della popolazione

def discrete_SIR(S1,I1,R1,t,beta,gamma):
    # Matrici vuote per ogni classe
    S = [] # popolazione suscettibile
    I = [] # popolazione infetta
    R = [] # popolazione rimossa
    N = S1+I1+R1 # popolazione totale
    
    # Aggiungere i valori iniziali
    S.append(S1)
    I.append(I1)
    R.append(R1)
    
    # applicare il modello SIR: iterare sul numero totale di giorni - 1
    for i in range(t-1):
        S_next = S[i] - (beta/N)*((S[i]*I[i]))
        S.append(S_next)
        
        I_next = I[i] + (beta/N)*((S[i]*I[i])) - gamma*I[i]
        I.append(I_next)
        
        R_next = R[i] + gamma * I[i]
        R.append(R_next)
    
    # ritorna un array S,I,R le cui voci sono vari valori per suscettibili, infetti, rimossi 
    return((S,I,R))

***
##  Modellare un'epidemia legata al SARS-CoV-2

Era da decenni che un'epidemia di queste dimensioni colpiva un così alto numero di persone in giro per il mondo. Per sapere di più sulla SARS-CoV-2 questi link sono utili e i più informativi: 

- [Istituto superiore di sanità](https://www.epicentro.iss.it/coronavirus/cosa-sono)
- [World Health Organization](https://www.who.int/health-topics/coronaviru+s)
- [Centro europeo per la prevenzione e il controllo delle malattie](https://www.ecdc.europa.eu/en/novel-coronavirus-china)
- [Un Tracker della diffusione del virus SARS-CoV-2](https://shiny.john-coene.com/coronavirus/) sviluppato da [John Coene](https://john-coene.com/)
- Un ottimo articolo di [Paolo Giordano](https://www.corriere.it/cronache/20_febbraio_25/matematicadel-contagioche-ci-aiutaa-ragionarein-mezzo-caos-3ddfefc6-5810-11ea-a2d7-f1bec9902bd3.shtml?refresh_ce-cp) uscito sul **Corriere della Sera** spiega con un linguaggio accessibile a tutti la matematica dietro il modello SIR.
- [Ministero della Salute di Singapore](https://co.vid19.sg/) ha creato una dashboard di tutti i casi a Singapore 

Il termine medico-matematico usato per descrivere quanto contagioso un virus sia è **$R_0$** (erre con zero). Non è ancora chiaro per quanto sia contagioso il virus, soprattutto perché questo valore non è fisso ma cambia da individuo a individuo visto che **$R_0$** non è altro che il numero di persone che, in media, un individuo infetto contagia a sua volta. 

- la formula matematica per calcolare $R_0$ è:     $R_0$= $\dfrac{\beta}{\gamma}$

Quanto è "contagiosa" la SARS-CoV-2 rispetto ad altri virus? Grafico 1, dati presi da [CDC-WHO](https://stacks.cdc.gov/view/cdc/27929) e [Riou & Althaus (2020)](https://www.eurosurveillance.org/content/10.2807/1560-7917.ES.2020.25.4.2000058)

| Nome Malattia  |Valore $R_0$ |Via di trasmissione |
|----------------|-------------|----------|
|Morbillo |12-18| aerea|
|Difterite |6-7| saliva|
|**COVID-19** |**1,4-2,8**| Gocciolina aerea|
|Influenza Spagnola |2-3| Gocciolina aerea|
|Ebola |1,5-2,5| Fluido corporeo|
|MERS |0,3-0,8| Gocciolina aerea|

Sebbene il **$R_0$** sia più basso rispetto ad altre malattie non vuol dire che sia una buona notizia. Per evitare la diffusione di una epidemia, $R_0$ deve essere inferiore a 1 perché vuol dire che ogni persona infetta non riesce a contagiare un'altra persona e quindi la malattia si arresta da sola. 

Il **grafico 2** qui sotto rappresenta i nuovi casi di SARS-CoV-2 in Italia nell'ultima settimana.
 
| Data  |Numero Giorno | Nuovi Infetti | 
|-------|-------------|----------|
|Feb 24 2020|1|10| 
|Feb 25 2020|2|91|
|Feb 26 2020|3|78|
|Feb 27 2020|4|250|
|Feb 28 2020|5|171|
|Feb 29 2020|6|228|
|Mar 01 2020|7|528|

È stato stimato a circa **7 giorni** il tempo medio che intercorre tra quando una persona viene infettata e quando comincia ad infettare altre persone. Questo è il motivo principale per cui le varie istituzioni hanno imposto misure di quarantena e hanno tenute le scuole chiuse per due settimana.

Con le informazioni appena discusse, siamo in grado di ottenere i parametri del modello SIR 

***
### Applicazione della teoria: come funziona il modello?
#### Per rispondere alle seguenti domande bastano carta, penna e una calcolatrice (le soluzioni sono in fondo a questo documento)

Supponiamo che questi siano i dati di una località infetta dal SARS-CoV-2 con i dati registrati ogni 2 settimane per il totale dell'epidemia che dura 112 giorni.

| Data  |Numero Giorno |Suscettibili | Infetti | 
|-------||-------------|----------|
|Dic 19 2019|0|254|7| 
|Gen 3 2020|14|235|14|
|Gen 19 2020|28|201|22|
|Feb 3 2020|42|153|29|
|Feb 19 2020|56|121| 21|
|Mar 3 2020|70|108|8|
|Mar 19 2020|84|121|21|
|Apr 3 2020| 98|NA | NA|
|Apri 19 2020|112| 83 | 0|

### Domanda 1:
Supponendo che il 19 Dicembre non fosse morto nessun individuo, cioè che nessuno fosse nella classe dei Rimossi, qual è il valore di $N$, cioè il numero di individui nella popolazione totale? 

### Domanda 2:

Supponiamo che il tempo medio di prima che un individuo infetto passai dal gruppo **Infetti** a quello **Rimossi** è di 11 giorni. Qual è il tasso di rimozione $\gamma$?

### Domanda 3:

Stiamo provando qualcosa di più difficile ma più interessante. Abbiamo introdotto un modello matematico per le epidemie, ma finora nulla dimostra che questo modello SIR sia appropriato per modellare un'epidemia come quella della SARS-CoV-2. Vogliamo rispondere a questa domanda ora. Per trovare il valore di $\beta$ più adatto bisogna risolvere questa equazione. 

Equazione da risolvere:<br/>
$R_0$= $\dfrac{\beta}{\gamma}$ 

- $\gamma = \dfrac{1}{T}$   
- in questo caso  T=11
- in questo caso $R_0$= 1,6566

Qual è il valore migliore di $\beta$ per la simulazione qui sotto?

In [2]:
from ipywidgets import interact_manual, widgets
import matplotlib.pyplot as plt

# set style
s = {'description_width': 'initial'}

# Set interact manual box widget for beta
@interact_manual(answer=widgets.FloatText(value=0.50, description='Inserisci un valore per ' + r'$ \beta$',
    disabled=False, style=s, step=0.01
))

# definire la funzione per trovare il valore appropriato di beta
# questa funzione prende come ingresso un valore fluttuante e 
# fornisce in uscita un grafico con la curva di miglior adattamento
def find_beta(answer):
    
    # impostare i valori iniziali per il modello SIR
    S1,I1,R1 = 254,7,0
    
    # Utilizzare i dati d'esempio su Numero di infetti da tabella nel notebook
    ori_data = [7,14,22,29,21,8,21,0]
    
    # giorni di utilizzo, i dati relativi all'orario sono stati forniti bisettimanalmente, 
    # qui si trasformiamo in giorni
    ori_days = [1,14,28,42,56,70,84,112]
    
    # imposta il numero di giorni come penultima voce della matrice ori_days 
    n = ori_days[len(ori_days)-1]-ori_days[0]+1
    
    # ottenere la beta dalla risposta - per essere sicuri di trasformarsi in float
    beta = float(answer)
    
    # La gamma è stata ottenuta dalla malattia
    gamma = 1/11
    
    # Calcolare i valori SIR utilizzando la nostra funzione discrete_SIR creata prima
    (S,I,R) = discrete_SIR(S1,I1,R1,n,beta,gamma)
    
    # Creazione Figura di base
    fig,ax = plt.subplots(figsize=(10,10))
 
    # Grafico di diffusione del numero originale del numero di infetti nel corso di 112 giorni
    plt.scatter(ori_days,ori_data,c="blue", label="Dati Esempio")
    
    # Grafico di diffusione di infetti ottenuta dalla modalità SIR, nel corso di 112 giorni
    plt.scatter(range(n),I,c="red",label="Modello SIR Previsioni")
    
    # Make the plot pretty
    plt.xlabel('Tempo (giorni)')
    plt.ylabel('Individui Infetti')
    plt.title('Dati Esempio vs Modello')
    legend = ax.legend()
    plt.show()

interactive(children=(FloatText(value=0.5, description='Inserisci un valore per $ \\beta$', step=0.01, style=D…

***
## Simulazione della diffusione del COVID-19

Per concludere, useremo i widget qui sotto per simulare diversi casi di diffusione della SARS-CoV-19 utilizzando il modello SIR. 
È possibile scegliere i valori di tutti gli elementi del modello (dimensioni dei compartimenti della popolazione all'inizio dell'epidemia, parametri $\gamma$ e $\beta$, e durata in unità di tempo (giorni) dell'epidemia. I parametri predefiniti sono approssimativi di quelli dell'epidemia SARS-CoV-19. 

Il risultato è una serie di tre grafici che mostrano come le tre componenti della popolazione cambiano durante l'epidemia. Esso consente di vedere l'impatto delle modifiche dei parametri $\gamma$ e $\beta$, come l'aumento di $\beta$ (che rende più veloce l'avanzamento dell'epidemia) o la riduzione di $\gamma$ (che diminuisce il tasso di rimozione).

È possibile utilizzare questo strumento interattivo per cercare di adattare il modello SIR ai dati osservati.

**Crea diverse simulazioni di diffusione del virus utilizzando il codice qui sotto per capire come cambia la diffusione del virus al cambiare delle diverse variabili. Quali sono le variabili più importanti da considerare? e perché?**

Puoi esportare le diverse immagini generate cliccandoci sopra con il pulsante destro e "salva immagine come".

In [3]:
import matplotlib.pyplot as plt
import numpy as np
from math import ceil

# Questa funzione prende come valori iniziali di ingresso di suscettibili, 
# infetti e rimossi, numero di giorni, beta e gamma
# traccia il modello SIR con le condizioni di cui sopra
def plot_SIR(S1,I1,R1,n,beta,gamma):
    
    # Inizializzare la figura
    fig = plt.figure(facecolor='w',figsize=(17,5))
    ax  = fig.add_subplot(111,facecolor = '#ffffff')
    
    # Calcolare i valori SIR per i nostri dati e parametri iniziali
    (S_f,I_f,R_f) = discrete_SIR(S1,I1,R1,n,beta,gamma)    
    
    # Impostare l'asse x
    x = [i for i in range(n)]
   
    # Grafico dell'evoluzione del suscettibile nel corso di x giorni
    ax.plot(x,S_f,c= 'b',label='Suscettibile')
    
    # Grafico dell'evoluzione degli infetti nel corso di x giorni
    ax.plot(x,I_f,c='r',label='Infetti')
    
    # Grafico dell'evoluzione di rimosso nel corso di x giorni
    ax.plot(x,R_f,c='g',label='Rimossi')

    # Rendere il grafico comprensibile
    plt.xlabel('Tempo (giorni)')
    plt.ylabel('Numero di persone')
    plt.title('Simulazione di un epidemia utilizzando il modello SIR')
    legend = ax.legend()
    plt.show()
    
    # Stampare questi messaggi per aiutare gli studenti a capire e interpretare ciò che accade nella trama
    print("DATI DI SIMULAZIONE\n")
    print("Beta: " + str(beta))
    print("Gamma: " + str(gamma))
    print("\n")
    print("Condizioni iniziali:")
    print("Numero totale di Suscettibili: "  + str(ceil(S_f[0])))
    print("Numero totale di Infetti: "  + str(ceil(I_f[0])))
    print("Numero totale di Rimosso: "  + str(ceil(R_f[0])))
    print("\n")
    print("Dopo " + str(n) + " giorni:")
    print("Numero totale di Suscettibili: "  + str(ceil(S_f[n-1])))
    print("Numero totale di Infetti: "  + str(ceil(I_f[n-1])) )
    print("Numero totale di Rimosso: "  + str(ceil(R_f[n-1])))

# Ottimizzazione dei valori iniziali
from ipywidgets import widgets, interact, interact_manual

# Impostare la funzione di cui sopra in modo che l'utente possa impostare 
# tutti i parametri e avviare manualmente la simulazione
s = {'description_width': 'initial'}
interact_manual(plot_SIR,
        S1 = widgets.IntSlider(value=500, min=200, max=10000, step=1, style=s, description="Suscettibili iniziale", 
                               disabled=False, orientation='horizontal', readout=True),
        I1 = widgets.IntSlider(value=7, min=0, max=500, step=1, style=s, description="Infetti iniziale",
                               disabled=False, orientation='horizontal', readout=True),
        R1 = widgets.IntSlider(value=0, min=0, max=500, step=1, style=s, description="Rimossi Iniziale",
                               disabled=False, orientation='horizontal', readout=True),
        n = widgets.IntSlider(value=112, min=0, max=500, step=1, style=s, description="Tempo (giorni)",
                              disabled=False, orientation='horizontal', readout=True),
        beta = widgets.FloatText(value=2.50, description=r'parametro $ \beta$ ',
                                 disabled=False, style = s, step=0.01),
        gamma = widgets.FloatText(value=1.50, description= r'parametro $ \gamma$ ',
                                  disabled=False, style=s, step=0.01)
        );

interactive(children=(IntSlider(value=500, description='Suscettibili iniziale', max=10000, min=200, style=Slid…

***
### Risposta 1
Poiché si suppone che la popolazione sia costante, e poiché $S_1 = 254, I_1 = 7, R_1 = 0$ (avevamo detto che non vi erano stati ne morti ne guariti precedentemente), allora $S_1 + I_1 + R_1 = 254 + 7 + 0 = 261$.

### Risposta 2
Sappiamo che, in media, un individuo rimane infetto per circa 11 giorni. Ciò significa che un individuo si sposta nella classe Rimossi ogni 11 giorni, e il tasso di rimozione è di $ \gamma = \frac{1}{11} = 0,0909...$.

### Risposta 3
Il valore migliore è di circa $\beta = 0.14909440503418078$.

***
<h2 align='center'>Sfida Finale</h2>

In questo Jupyter Notebook abbiamo studiato il modello matematico SIR per modellare un'epidemia. Abbiamo appreso che questo modello è uno dei più semplici e che separa la popolazione totale $N$ (una costante) in tre categorie: Infetta, Suscettibile e Rimossa. Abbiamo imparato a conoscere i tassi di infezione e rimozione e come questo influisce sul numero di individui in ogni classe. 

Abbiamo anche eseguito una simulazione di base, ma realistica, di un'epidemia di SARS-CoV-19

Ora tocca a te, i dati non sono le informazioni: lo diventano quando diamo loro un significato.Ora che abbiamo capito come lavorare sull'estrazione dei dati, l'attribuzione di un significato e la trasformazione di dati e significati in modo che siano comprensibili e visualizzabili. 

Le presentazione finali possono essere un video su YouTube, screencast dello script di Python, grafico, powerpoint e altri strumenti che i ragazzi possono scegliere per meglio convogliare il loro messaggio e spiegare il modello SIR. Caricate o fate le presentazioni direttamente su Classroom.   