In [1]:
import pandas as pd
import numpy as np
%matplotlib notebook
import matplotlib.pyplot as plt

Alle data staan online beschikbaar, dus ik lees ze hieronder in:

In [2]:
url_confirmed = 'https://epistat.sciensano.be/Data/COVID19BE_CASES_AGESEX.csv'
url_tested = 'https://epistat.sciensano.be/Data/COVID19BE_tests.csv'
confirmed = pd.read_csv(url_confirmed, parse_dates=['DATE'])
tested = pd.read_csv(url_tested, parse_dates=['DATE'])

In [3]:
confirmed.head()

Unnamed: 0,DATE,PROVINCE,REGION,AGEGROUP,SEX,CASES
0,2020-03-01,Antwerpen,Flanders,40-49,M,1
1,2020-03-01,Brussels,Brussels,10-19,M,1
2,2020-03-01,Brussels,Brussels,10-19,F,1
3,2020-03-01,Brussels,Brussels,20-29,M,1
4,2020-03-01,Brussels,Brussels,30-39,F,1


In [4]:
tested.head()

Unnamed: 0,DATE,PROVINCE,TESTS_ALL,REGION
0,2020-03-01,,1,
1,2020-03-01,Antwerpen,18,Flanders
2,2020-03-01,BrabantWallon,8,Wallonia
3,2020-03-01,Brussels,4,Brussels
4,2020-03-01,Hainaut,5,Wallonia


We tellen alle gevallen op per dag:

In [5]:
daily_confirmed = confirmed.set_index('DATE').resample('D').sum().reset_index()
daily_tested = tested.set_index('DATE').resample('D').sum().reset_index()

We verwijderen de laatste 3 dagen uit de data, want mogelijks zijn deze data nog niet volledig.    
We berekenen aantal bevestigde gevallen per 1000 testen. Noot hierbij: indien eenzelfde persoon 2 keer wordt getest, dan worden beide testen hierin geteld, want Sciensano geeft niet aan in de data welke testen samenhoren. Dus, in werkelijkheid is het aantal testen, in de noemer, lager, dus het aantal bevestigde gevallen per 1000 hoger.   
Hiervan nemen we een gemiddelde over de laatste 7 dagen, om dagelijkse ruis (en bvb onderraportering in het weekend) weg te werken.

In [6]:
daily_data = pd.merge(daily_confirmed, daily_tested, on='DATE')
daily_data = daily_data.iloc[:-3].copy()
daily_data['positiv_ratio'] = daily_data.CASES/daily_data.TESTS_ALL*100
daily_data['positiv_ratio_mov_win'] = daily_data.positiv_ratio.rolling(window=7).mean()
daily_data['cases_mov_win'] = daily_data.CASES.rolling(window=7).mean()
daily_data['tests_mov_win'] = daily_data.TESTS_ALL.rolling(window=7).mean()

Hieronder het aantal bevestigde gevallen per 100 tests (positiviteitsratio), vanaf het begin van de pandemie. Deze grafiek is echter **niet bruikbaar** om de huidige situatie te vergelijken met maart-april, want toen werden (nagenoeg) enkel gehospitaliseerden getest.

In [7]:
fig,ax = plt.subplots()
daily_data.plot('DATE', 'positiv_ratio_mov_win', ax=ax, legend=None, x_compat=True)
ax.set_title('Aantal positieve gevallen per 100 tests')

<IPython.core.display.Javascript object>

Text(0.5, 1.0, 'Aantal positieve gevallen per 100 tests')

Hieronder zie je hoe weinig er getest werd in maart-april, vergeleken met sinds mei-juni. Inderdaad, er wordt nu meer getest, maar het aantal gevallen per test neemt ook toe (zie volgende grafiek).

In [8]:
fig,ax = plt.subplots()
daily_data.plot('DATE', 'tests_mov_win', ax=ax, x_compat=True, legend=None)
ax.set_title('Aantal testen per dag')

<IPython.core.display.Javascript object>

Text(0.5, 1.0, 'Aantal testen per dag')

Hieronder dezelfde grafiek, maar enkel vanaf juni en ingezoomd op de y-as. Sinds juni (en zeker juli) is er genoeg testcapaciteit en wordt er veel meer getest, dus dit kunnen we vergelijken. We zien een sterke stijging in juli, afgevlakt in augustus, en opnieuw een sterke stijging in september (maar wel al met een hoger beginpunt).   

In [9]:
fig,ax = plt.subplots()
daily_data.plot('DATE', 'positiv_ratio_mov_win', ax=ax, x_compat=True, legend=None)
ax.set_xlim('2020-06', '2020-10')
ax.set_ylim(0,5)
ax.set_title('Aantal positieve gevallen per 100 tests (juni-september)')


<IPython.core.display.Javascript object>

Text(0.5, 1.0, 'Aantal positieve gevallen per 100 tests (juni-september)')

In [10]:
fig,ax = plt.subplots()
daily_data.plot('DATE', 'positiv_ratio_mov_win', ax=ax, x_compat=True, legend=None)
ax.set_xlim('2020-08', daily_data.DATE.max()+pd.to_timedelta('1D'))
ax.set_ylim(0,5)
ax.set_title('Aantal positieve gevallen per 100 tests (aug-september)')


<IPython.core.display.Javascript object>

Text(0.5, 1.0, 'Aantal positieve gevallen per 100 tests (aug-september)')

In [None]:
# fig,ax1 = plt.subplots()
# daily_data.plot('DATE', 'cases_per_1000tests_mov_win', ax=ax1, x_compat=True, label='cases/tests', c='green')
# ax2 = ax1.twinx()
# daily_data.plot('DATE', 'cases_mov_win', ax=ax2, x_compat=True, label='cases', c='blue')


# ax1.set_xlim('2020-06', '2020-10')
# ax1.set_ylim(0,50)
# ax2.set_ylim(0,1400)
# ax.set_title('Aantal positieve gevallen (juni-september)')

In [None]:
# daily_data.set_index('DATE')['2020-09-11':'2020-09-17'].CASES.mean()
# daily_data.set_index('DATE')['2020-09-11':'2020-09-17'].TESTS_ALL.mean()