<img src="images/logodwengo.png" alt="LogoDwengo" width="150"/>

<div>
    <font color=#690027 markdown="1">
        <h1>COVID-19 in België</h1> 
    </font>
</div>

<div class="alert alert-box alert-success">
In dit project bestudeer je de evolutie van het aantal coronagevallen in België. 
Je bekijkt de exponentiële groei en hoe de groeifactor evolueert doordat mensen zich moeten houden aan de <em>'social distance'</em>-regel.   
</div>

Cijfers over corona in België vind je bijvoorbeeld op:
> https://data.europa.eu/euodp/en/data/dataset/covid-19-coronavirus-data/resource/260bbbde-2316-40eb-aec3-7cd7bfc2f590 <br>
> https://epistat.wiv-isp.be/covid/covid-19.html 

### De nodige modules importeren

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

from scipy.optimize import curve_fit

<div>
    <font color=#690027 markdown="1">
        <h2>1. Aantal gevallen van eind december 2019 tot 29 maart 2020</h2> 
    </font>
</div>

In [None]:
corona = pd.read_csv("data/covidbelgie.csv") 

In [None]:
# bekijk tabel
corona

In [None]:
# bekijk deel tabel
corona[0:40]

In [None]:
# bekijk deel tabel vanaf eerste geval (2 maart 2020)
corona[0:28]

In [None]:
# aantal gevallen uit tabel halen
x2 = corona["gevallen"]
x2 = x2[0:28]
x2 = np.array(x2)
print(x2)

In [None]:
# lijst maken voor dagen verloop corona
periode = len(x2)
x1 = np.arange(0, periode, 1)
print(x1)

In [None]:
# tabel begint met laatste dag, ervoor zorgen dat eerste dag overeenkomt met het eerste geval
x1 = 27 - x1
print(x1)

In [None]:
x3 = corona ["doden"]
x3 = x3[0:28]
x3 = np.array(x3)
print(x3)

In [None]:
# grafiek 
plt.figure(figsize=(10,5))

plt.subplot(1,2,1)
plt.xlim(0, 30)
plt.ylim(0, 1500)
plt.title("Besmettingen van COVID-19")
plt.xlabel("dag sinds 2 maart 2020")
plt.ylabel("aantal besmettingen")
plt.scatter(x1, x2, marker =".", color="blue")

plt.subplot(1,2,2)
plt.xlim(0, 30)
plt.ylim(0, 75)
plt.title("Gestorven aan COVID-19")
plt.xlabel("dag sinds 2 maart 2020")
plt.ylabel("aantal gestorven mensen")
plt.scatter(x1, x3, marker =".", color="red")

plt.show()

Zowel het dagelijkse aantal gevallen als het dagelijkse aantal overledenen lijkt exponentieel te stijgen.<br>
In puntje 3 bekijk je of er een exponentiële functie past bij de data van het aantal gevallen.

<div>
    <font color=#690027 markdown="1">
        <h2>2. De nodige functies definiëren</h2>
    </font>
</div>

Je zal exponentiële functies nodig hebben en exponentiële regressie.<br>
Je definieert de nodige functies a.d.h.v. de volgende code-cel. 

In [None]:
def exp(x, a, b):
    """Voorschrift exponentiële functie."""
    return b * a**x 

def expreg(x, y):
    """Best passende kromme bepalen."""
    popt, pcov = curve_fit(exp, x, y)         # curve_fit kijkt in def exp hoe die functie eruit ziet
    # curve_fit geeft twee zaken terug, waaraan gerefereerd wordt met popt en pcov
    # enkel eerste nodig, die a en b van gezochte exponentiële functie geeft
    a =  popt[0]
    b =  popt[1]
    print("y =", b, "*", a, "**x voor periode", x)      # toon voorschrift
    return a, b                                 # geeft parameters terug uit vergelijking exponentiële functie

<div>
    <font color=#690027 markdown="1">
        <h2>3. Exponentiële regressie</h2> 
    </font>
</div>

<div class="alert alert-box alert-warning">
Je hebt misschien al een best passende kromme gezocht met je grafische rekenmachine, bv. met een TI-84. Je gebruikt daar `ExpReg`.
De kromme die je vindt met je rekentoestel, kan een beetje afwijken van die die je hier vindt. Dat komt omdat je rekenmachine de vergelijking van de kromme op een iets andere manier berekent, omdat ze met een ander algoritme is geprogrammeerd.  
</div>

In [None]:
# grafiek aantal besmettingen met regressielijn

a1, b1 = expreg(x1, x2)
y1_regressielijn = exp(x1, a1, b1)       # voor elke x1-waarde overeenkomstige y-waarde op de regressilijn berekenen

plt.figure(figsize=(20,10))

plt.xlim(0, 30)
plt.ylim(0, 2000)
plt.title("Besmettingen van COVID-19")
plt.xlabel("dag sinds 2 maart 2020")
plt.ylabel("aantal besmettingen")

plt.scatter(x1, x2, marker =".", color="blue")
plt.plot(x1, y1_regressielijn, color="lightblue")

plt.show()

# yr = 6.4 * 1.235**x1   # ExpReg met TI-84

Men zegt echter dat de groei vertraagt. <br>
Dat betekent dat je specifiek voor het laatste deel van de periode op zoek gaat naar een andere, beter passende exponentiële functie; deze zou dan een kleinere groeifactor hebben. 

In [None]:
# grafiek beter model

x11 = x1[0:15]   # laatste deel
x12 = x1[14:]    # eerste deel
x21 = x2[0:15]
x22 = x2[14:]

a11, b11 = expreg(x11, x21)    # laatste deel
a12, b12 = expreg(x12, x22)    # eerste deel
y11_regressielijn = exp(x11, a11, b11)  
y12_regressielijn = exp(x12, a12, b12)  

plt.figure(figsize=(20,10))

plt.xlim(0, 30)
plt.ylim(0, 2000)
plt.title("Besmettingen van COVID-19")
plt.xlabel("dag sinds 2 maart 2020")
plt.ylabel("aantal besmettingen")

plt.scatter(x1, x2, marker =".", color="blue")
plt.plot(x11, y11_regressielijn, color="green")
plt.plot(x12, y12_regressielijn,  color="yellow")

plt.show()

# y1 = 4.9 * 1.26**x1          # ExpReg met TI-84 van dag 0 t.e.m. dag 12
# y2 = 18.24 * 1.17**x1        # ExpReg met TI-84 van dag 13 t.e.m. dag 27

<div>
    <font color=#690027 markdown="1">
        <h2>4. Aantal mensen in het ziekenhuis van 15 maart 2020 tot 29 maart 2020</h2> 
    </font>
</div>

In [None]:
ziekenhuis = pd.read_csv("data/ziekenhuisbezetting.csv")     

In [None]:
ziekenhuis

In [None]:
# aantal gestorven
xz2 = ziekenhuis["Doden"]
xz2 = np.array(xz2)
print(xz2)
# over hoeveel opeenvolgende dagen gaat het hier?
aantaldagen = len(xz2)
print("aantal dagen = ", aantaldagen)
# NumPy-lijst maken met de opeenvolgende dagen
xz1 = np.arange(0, aantaldagen, 1)
print(xz1)
# aantal opgenomen
xz3 = ziekenhuis["Actuele bezetting ziekenhuizen"]
xz3 = np.array(xz3)
print(xz3)
# aantal op IZ
xz4 = ziekenhuis["Waarvan op intensieve"]
xz4 = np.array(xz4)
print(xz4)

In [None]:
# grafiek mensen in ziekenhuis en op intensieve zorg
plt.figure(figsize=(20,10))

plt.subplot(1,2,1)
plt.xlim(0, aantaldagen+10)
plt.ylim(0, np.max(xz3)+3000)
plt.title("Opgenomen met COVID-19")
plt.xlabel("dag sinds 15 maart 2020")
plt.ylabel("aantal in ziekenhuis")

plt.scatter(xz1, xz3, marker =".", color="blue")

plt.subplot(1,2,2)
plt.xlim(0, np.max(xz1)+10)
plt.ylim(0, np.max(xz3)+3000)
plt.title("Op IZ met COVID-19")
plt.xlabel("dag sinds 15 maart 2020")
plt.ylabel("aantal op intensieve zorg")

plt.scatter(xz1, xz4, marker =".", color="purple")

plt.show()

<div>
    <font color=#690027 markdown="1">
        <h3>Groei en exponentiële regressie</h3> 
    </font>
</div>

In [None]:
# toename aantal mensen in ziekenhuis
groeifactor = np.zeros(aantaldagen-1)
for i in range(0, aantaldagen-1):
    groeifactor[i] = xz3[i+1] / xz3[i]
print(groeifactor)

In [None]:
# toename aantal mensen op intensieve zorg
groeifactor2 = np.zeros(aantaldagen-1)
for i in range(0, aantaldagen-1):
    groeifactor2[i] = xz4[i+1] / xz4[i]
print(groeifactor2)

De verhoudingen zijn vrij constant. Dat wijst voor beide problemen op een exponentiële groei. 

In [None]:
# grafiek 

xz11 = xz1[0:7]
xz12 = xz1[6:]
xz31 = xz3[0:7]
xz32 = xz3[6:]

# exponentiële regressie opgenomen
az3, bz3 = expreg(xz1, xz3)   
az11, bz11 = expreg(xz11, xz31)
az12, bz12 = expreg(xz12, xz32)
# exponentiële regressie IZ
az4, bz4 = expreg(xz1, xz4)

yz3_regressielijn = exp(xz1, az3, bz3)
yz11_regressielijn = exp(xz11, az11, bz11)
yz12_regressielijn = exp(xz12, az12, bz12 )
yz4_regressielijn = exp(xz1,az4, bz4)


plt.figure(figsize=(20,10))

plt.subplot(1,2,1)
plt.xlim(0, aantaldagen+10)
plt.ylim(0, np.max(xz3)+3000)
plt.title("Opgenomen met COVID-19")
plt.xlabel("dag sinds 15 maart 2020")
plt.ylabel("aantal in ziekenhuis")

plt.scatter(xz1, xz3, marker =".", color="blue")
plt.plot(xz1, yz3_regressielijn, color="lightblue")
plt.plot(xz11, yz11_regressielijn, color="green")     # eerste deel
plt.plot(xz12, yz12_regressielijn , color="yellow")    # tweede deel

plt.subplot(1,2,2)
plt.xlim(0, np.max(xz1)+10)
plt.ylim(0, np.max(xz4)+3000)
plt.title("Op IZ met COVID-19")
plt.xlabel("dag sinds 15 maart 2020")
plt.ylabel("aantal op intensieve zorg")

plt.scatter(xz1, xz4, marker =".", color="purple")
plt.plot(xz1, yz4_regressielijn, color="purple")

plt.show()

# yz3 = 236.63 * 1.25**xz1      # ExpReg met TI-84
# yz31 = 181 * 1.36**xz1        # ExpReg met TI-84 van dag 0 t.e.m. dag 6
# yz32 = 423 * 1.18**xz1        # ExpReg met TI-84 van dag 6 tot einde
# yz4 = 48.38 * 1.25**xz1       # ExpReg met TI-84 

<div>
    <font color=#690027 markdown="1">
        <h2>5. Aantal overledenen van 15 maart 2020 tot 29 maart 2020</h2> 
    </font>
</div>

In [None]:
# cumulatief aantal overledenen
xz2 = ziekenhuis["Doden"]    # totaal aantal
xz2 = np.array(xz2)
print(xz2)

In [None]:
# evolutie aantal gestorven mensen per dag, m.a.w. aantal overledenen die dag is gezocht
xz5 = np.zeros(aantaldagen)     # NumPy array genereren van juiste lengte
print(xz5)

# NumPy array vullen met juiste waarden
xz5[0] = xz2[0]                   
for i in range(1, aantaldagen):
    xz5[i] = xz2[i] - xz2[i-1]
    
print(xz5)

In [None]:
# grafiek 
plt.figure()

plt.xlim(0, aantaldagen+5)
plt.ylim(0, np.max(xz5)+100)
plt.title("Overleden aan COVID-19")
plt.xlabel("dag sinds 15 maart 2020")
plt.ylabel("aantal gestorven mensen per dag")

plt.scatter(xz1, xz5, marker =".", color="red")

plt.show()

<div>
    <font color=#690027 markdown="1">
        <h3>Groei en exponentiële regressie</h3> 
    </font>
</div>

In [None]:
# exponentieel
groeifactordoden = np.zeros(aantaldagen-1)
for i in range(0, aantaldagen-1):
    groeifactordoden[i] = xz5[i+1] / xz5[i]
print(groeifactordoden)

In [None]:
# grafiek

# exponentiële regressie overleden
az1, bz1 = expreg(xz1, xz5)
yz5_regressielijn = exp(xz1, az1, bz1)

plt.figure()

plt.xlim(0, aantaldagen+5)
plt.ylim(0, np.max(xz5)+100)
plt.title("Overleden aan COVID-19")
plt.xlabel("dag sinds 15 maart 2020")
plt.ylabel("aantal doden per dag")

plt.scatter(xz1, xz5, marker =".", color="red")
plt.plot(xz1, yz5_regressielijn, color="red")

plt.show()

# yz5 = 2.38 * 1.3**xz1          # exponentiële regressie

## Opdracht

-  Bekijk de nieuwste data op https://epistat.wiv-isp.be/covid/covid-19.html van de mensen opgenomen in de ziekenhuizen (periode ingeven en rechts klikken op de getoonde grafiek om te downloaden als csv-bestand). 
-  Maak NumPy-lijsten aan met de nieuwe data.
-  Maak voor een zelfgekozen periode aangepaste grafieken die de evolutie van het aantal mensen dat opgenomen is in de ziekenhuizen, weergeven. Doe dat door de code aan te passen.

In [None]:
# Tip
lijst1 = np.array([1,2,3])
lijst2 = np.array([4,5,6,7,8])
samengevoegdelijst = np.append(lijst1, lijst2)
print(samengevoegdelijst)

<div class="alert alert-box alert-success">
Wil je meer weten over hoe besmettelijke ziektes zich verspreiden? <br>
In de notebooks van <b>'Simuleer een epidemie'</b> kan je een epidemie simuleren doorheen een sociaal netwerk, en onderzoeken welke strategieën de ziekte het best onder de knoet kunnen houden.   
</div>

### Referentielijst

Datawrapper. Corona in België. https://www.datawrapper.de/_/dFAEh/ opgemaakt door Het Laatste Nieuws met cijfers van de FOD Gezondheid met het aantal gehospitaliseerden, mensen op intensieve zorg en sterfgevallen.

<img src="images/cclic.png" alt="Banner" align="left" width="100"/><br><br>
Deze notebook van N. Gesquière voor Dwengo vzw is in licentie gegeven volgens een <a href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen 4.0 Internationaal-licentie</a>. 