# COVID-19 Auswertung - new cases, deaths, Intensivstationen
## DIVI und WHO Daten - Deutschland und einige Nachbarn


## import libraries

In [89]:
import pandas as pd #Daten
from matplotlib import pyplot as plt # plots
import numpy as np

# performance
from datetime import datetime
from datetime import date # todays date
import seaborn as sns

import os
now = datetime.now()

# Preprocessing Dataframes

## Datenimport

In [90]:
# Webabruf - CSV einlesen
data = pd.read_csv("https://covid19.who.int/WHO-COVID-19-global-data.csv")

# Lokal - CSV einlesen
df = pd.read_csv("D:\Github\Covid-19-Auswertung-WHO-DIVI\data-WvhXR.csv")

### preprocessing

In [91]:
#gleitender Mittelwert der cases und deaths, 7 Tage
data['MA'] = data['New_cases'].rolling(window=7,min_periods=1).mean()
data['MA_deaths'] = data['New_deaths'].rolling(window=7, min_periods=1).mean()

data['MSTD_cases'] = data['New_cases'].rolling(window=7,min_periods=1).std()
data['MSTD_deaths'] = data['New_deaths'].rolling(window=7,min_periods=1).std()

data['OTG_cases'] = data['MA'] + data['MSTD_cases']
data['UTG_cases'] = data['MA'] - data['MSTD_cases']

data['OTG_deaths'] = data['MA_deaths'] + data['MSTD_deaths']
data['UTG_deaths'] = data['MA_deaths'] - data['MSTD_deaths']

# Date_reported in eine Datumsspalte umwandeln
data['Date_reported'] = pd.to_datetime(data.Date_reported, utc=True)

df['date'] = pd.to_datetime(df.date, utc=True)

#Timestamp definieren  YYYY-MM-DD
ts = pd.to_datetime('2020-10-01', utc=True)

#dataframe reduzieren 
data = data.loc[data.Date_reported >= ts, :]
df = df.loc[df.date >= ts, :]

### Länder definieren

In [92]:
ger = data[data.Country == 'Germany']
fr = data[data.Country == 'France']
at = data[data.Country == 'Austria']
pl = data[data.Country == 'Poland']
cz = data[data.Country == 'Czechia']
ch = data[data.Country == 'Switzerland']
it = data[data.Country == 'Italy']
es = data[data.Country == 'Spain']
gb = data[data.Country == 'The United Kingdom']
se = data[data.Country == 'Sweden']

#euro = data[data.WHO_region == 'EURO']

# Variablen für die Plots definieren

### Linien und Schriftgrößen

In [93]:
# Linien Stärke
lws = 3
lwb = 7
# Bezugsschriftgröße
size = 28

### Einwohnerzahlen

In [94]:
E_fr = 66012908
E_pl = 38659927
E_ger = 81504947
E_cz = 10586651
E_at = 8902600
E_ch = 8847020
E_gb = 66650000

 ### Bezugsgröße Einwohner und Datum

In [95]:
pE = 100000

# Heutiges Datum und formatieren dd.mm.YYYY
today = date.today().strftime("%d.%m.%Y")

### Speicherorte und Dateinamen

In [96]:
pfad = "D:\Github\Covid-19-Auswertung-WHO-DIVI\plots_Führungskreis"

name_1_1 = "\plot_1-1_cases_absolute numbers.jpg" # cases absoulte zahlen EU
name_1_2 = "\plot_1-2_cases.jpg" # cases pro 100.000 Einwohner EU 
name_2 = "\plot_2_intensiv.jpg" # intensiv Deutschland
name_3_1 = "\plot_3-1_deaths_absolute numbers.jpg" # deaths absolute zahlen EU
name_3_2 = "\plot_3-2_deaths.jpg" # deaths pro 100.000 Einwohner EU
name_4_1 = "\plot_4-1_cases_ger.jpg" # cases Deutschland
name_4_2 = "\plot_4-2_deaths_ger.jpg" # deaths Deutschland
name_5 = "D:\Github\Covid-19-Auswertung-WHO-DIVI\performance_dist_Führungskreis.jpg" # Performance Plot

# Visualisierung der Plots

### 1-1) Neue Fälle 7 Tage Mittelwert (absolute Zahlen)

In [97]:
# Größe im 16:9 format und mit Umrechnungsfaktor 1.2 (durch Test ermittelt) für PowerPoint angepasst
plt.figure(figsize=(16/1.5,9/1.5))


# Neue Fälle pro Tag pro 100.000 Einwohner - 02.12.2020 

plt.plot(gb.Date_reported,gb['MA'], 'y--', linewidth = lws, label="Großbritannien")
plt.plot(ger.Date_reported,ger['MA'], 'b-', linewidth = lwb, label="Deutschland")
plt.plot(fr.Date_reported,fr['MA'], 'r--', linewidth = lws, label="Frankreich")
plt.plot(pl.Date_reported,pl['MA'], 'c--', linewidth = lws, label="Polen")
plt.plot(cz.Date_reported,cz['MA'], 'm--', linewidth = lws, label="Tschechien")
plt.plot(ch.Date_reported,ch['MA'], 'k--', linewidth = lws, label="Schweitz")
plt.plot(at.Date_reported,at['MA'], 'g--', linewidth = lws, label="Österreich")

plt.legend(loc='center left', 
           bbox_to_anchor=(1, 0.5),
           fancybox=True, 
           shadow=True, 
           ncol=1, 
           fontsize=size)

# Schriftgrößen x und y achsenwerte
plt.xticks(fontsize=size - 10, rotation=90)
plt.yticks(fontsize=size -4)

plt.ylabel('Neue Fälle', fontsize=size)
plt.title('Neue Fälle pro Tag (absolute Zahlen)  \n Stand: ' + today, fontsize=size)
plt.xlabel('Zeit', fontsize=size)

# Diagramm als Bild exporieren und Auflösung definieren
plt.savefig(pfad + name_1_1, dpi = 150, bbox_inches='tight')
plt.close()

### 1-2) Neue Fälle 7 Tage Mittelwert (pro 100.000 Einwohner)

In [98]:
# Größe im 16:9 format und mit Umrechnungsfaktor 1.2 (durch Test ermittelt) für PowerPoint angepasst
plt.figure(figsize=(16/1.5,9/1.5))


# Neue Fälle pro Tag pro 100.000 Einwohner - 02.12.2020 

plt.plot(cz.Date_reported,cz['MA']* (pE/E_cz), 'm--', linewidth = lws, label="Tschechien")
plt.plot(ch.Date_reported,ch['MA']* (pE/E_ch), 'k--', linewidth = lws, label="Schweitz")
plt.plot(gb.Date_reported,gb['MA']* (pE/E_gb), 'y--', linewidth = lws, label="Großbritannien")
plt.plot(ger.Date_reported,ger['MA']* (pE/E_ger), 'b-', linewidth = lwb, label="Deutschland")
plt.plot(at.Date_reported,at['MA']* (pE/E_at), 'g--', linewidth = lws, label="Österreich")

plt.plot(pl.Date_reported,pl['MA']* (pE/E_pl), 'c--', linewidth = lws, label="Polen")
plt.plot(fr.Date_reported,fr['MA']* (pE/E_fr), 'r--', linewidth = lws, label="Frankreich")

plt.legend(loc='center left', 
           bbox_to_anchor=(1, 0.5),
           fancybox=True, 
           shadow=True, 
           ncol=1, 
           fontsize=size)


# Schriftgrößen x und y achsenwerte
plt.xticks(fontsize=size - 10, rotation=90)
plt.yticks(fontsize=size -4)

plt.ylabel('Neue Fälle', fontsize=size)
plt.title('Neue Fälle pro Tag pro 100.000 Einwohner  \n Stand: ' + today, fontsize=size)
plt.xlabel('Zeit', fontsize=size)

# Diagramm als Bild exporieren und Auflösung definieren
plt.savefig(pfad + name_1_2, dpi = 150, bbox_inches='tight')
plt.close()

### 2) Intensivstationen DIVI

In [99]:
# Größe im 16:9 format und mit Umrechnungsfaktor 1.2 (durch Test ermittelt) für PowerPoint angepasst
plt.figure(figsize=(16/1.5,9/1.5))

plt.style.use('seaborn')
plt.grid(True)
plt.plot(df.date,df['COVID-19-Fälle'], 'b-', linewidth = lwb, label = "Intensiv-\nstationen \nDeutschland")
plt.legend(loc='center left', 
           bbox_to_anchor=(1, 0.5),
           fancybox=True, 
           shadow=True, 
           ncol=1, 
           fontsize=size)

# Schriftgrößen x und y achsenwerte
plt.xticks(fontsize=size - 10, rotation = 90)
plt.yticks(fontsize=size -4)

# plt.xticks([])
plt.ylabel('Anzahl Personen', fontsize=size)
plt.title('Intensivstationen Deutschland  \n Stand: ' + today, fontsize=size)
plt.xlabel('Zeit', fontsize=size)

# Diagramm als Bild exporieren und Auflösung definieren
plt.savefig(pfad + name_2, dpi = 150, bbox_inches='tight')
plt.close()

###  3-1) Todesfälle 7 Tage Mittelwert (absolute Zahlen) 

In [100]:
# Größe im 16:9 format und mit Umrechnungsfaktor 1.2 (durch Test ermittelt) für PowerPoint angepasst
plt.figure(figsize=(16/1.5,9/1.5))

plt.style.use('seaborn')
plt.grid(True)

# Todesfälle pro 100.000 Einwohner 02.12.2020
plt.plot(ger.Date_reported,ger['MA_deaths'], 'b-', linewidth = lwb, label = "Deutschland") # blau, linie, dick
plt.plot(gb.Date_reported,gb['MA_deaths'], 'y--', linewidth = lws, label = "Großbritannien") # gelb, gestrichelt, dünn
plt.plot(pl.Date_reported,pl['MA_deaths'], 'c--', linewidth = lws, label = "Polen") # cyan, gestrichelt, dünn
plt.plot(fr.Date_reported,fr['MA_deaths'], 'r--', linewidth = lws, label = "Frankreich") # rot, gestrichelt, dünn
plt.plot(cz.Date_reported,cz['MA_deaths'], 'm--', linewidth = lws, label = "Tschechien") # magenta, gestrichelt, dünn
plt.plot(at.Date_reported,at['MA_deaths'], 'g--', linewidth = lws, label = "Österreich") # grün, gestrichelt, dünn
plt.plot(ch.Date_reported,ch['MA_deaths'], 'k--', linewidth = lws, label = "Schweitz") # schwarz, gestrichelt, dünn





# Legende 
plt.legend(loc='center left', 
           bbox_to_anchor=(1, 0.5),
           fancybox=True, 
           shadow=True, 
           ncol=1, 
           fontsize=size)

# Schriftgrößen x und y achsenwerte
plt.xticks(fontsize=size - 10, rotation = 90)
plt.yticks(fontsize=size -4)
plt.ylabel('Todesfälle', fontsize=size)
plt.title('Todesfälle pro Tag (absolute Zahlen)  \n Stand: ' + today, fontsize=size)
plt.xlabel('Zeit', fontsize=size)

# Diagramm als Bild exporieren und Auflösung definieren
plt.savefig(pfad + name_3_1, dpi = 150, bbox_inches='tight')
plt.close()

###  3-2) Todesfälle 7 Tage Mittelwert (pro 100.000 Einwohner) 

In [101]:
# Größe im 16:9 format und mit Umrechnungsfaktor 1.2 (durch Test ermittelt) für PowerPoint angepasst
plt.figure(figsize=(16/1.5,9/1.5))

plt.style.use('seaborn')
plt.grid(True)

# Todesfälle pro 100.000 Einwohner 02.12.2020
plt.plot(at.Date_reported,at['MA_deaths'] * (pE/E_at), 'g--', linewidth = lws, label = "Österreich") # grün, gestrichelt, dünn
plt.plot(cz.Date_reported,cz['MA_deaths'] * (pE/E_cz), 'm--', linewidth = lws, label = "Tschechien") # magenta, gestrichelt, dünn
plt.plot(pl.Date_reported,pl['MA_deaths'] * (pE/E_pl), 'c--', linewidth = lws, label = "Polen") # cyan, gestrichelt, dünn
plt.plot(ch.Date_reported,ch['MA_deaths'] * (pE/E_ch), 'k--', linewidth = lws, label = "Schweitz") # schwarz, gestrichelt, dünn
plt.plot(ger.Date_reported,ger['MA_deaths'] * (pE/E_ger), 'b-', linewidth = lwb, label = "Deutschland") # blau, linie, dick
plt.plot(gb.Date_reported,gb['MA_deaths'] * (pE/E_gb), 'y--', linewidth = lws, label = "Großbritannien") # gelb, gestrichelt, dünn
plt.plot(fr.Date_reported,fr['MA_deaths'] * (pE/E_fr), 'r--', linewidth = lws, label = "Frankreich") # rot, gestrichelt, dünn


# Legende 
plt.legend(loc='center left', 
           bbox_to_anchor=(1, 0.5),
           fancybox=True, 
           shadow=True, 
           ncol=1, 
           fontsize=size)

# Schriftgrößen x und y achsenwerte
plt.xticks(fontsize=size - 10, rotation = 90)
plt.yticks(fontsize=size -4)
plt.ylabel('Todesfälle', fontsize=size)
plt.title('Todesfälle pro Tag pro 100.000 Einwohner  \n Stand: ' + today, fontsize=size)
plt.xlabel('Zeit', fontsize=size)

# Diagramm als Bild exporieren und Auflösung definieren
plt.savefig(pfad + name_3_2, dpi = 150, bbox_inches='tight')
plt.close()

###  4-1) Cases 7 Tage Mittelwert Deutschland

In [102]:
# Größe im 16:9 format und mit Umrechnungsfaktor 1.2 (durch Test ermittelt) für PowerPoint angepasst
plt.figure(figsize=(16/1.5,9/1.5))

# Neue Fälle pro Tag pro 100.000 Einwohner - 02.12.2020 
plt.plot(ger.Date_reported,ger['MA'], 'b-', linewidth = lwb, label = "Deutschland\n(7-Tage Mittel)")
plt.plot(ger.Date_reported,ger['New_cases'], '.')
plt.plot(ger.Date_reported,ger['OTG_cases'], 'r--', linewidth = lws, label ="+1 sigma")
plt.plot(ger.Date_reported,ger['UTG_cases'], 'r--', linewidth = lws, label ="-1 sigma")

plt.legend(loc='center left', 
           bbox_to_anchor=(1, 0.5),
           fancybox=True, 
           shadow=True, 
           ncol=1, 
           fontsize=size)

# Schriftgrößen x und y achsenwerte
plt.xticks(fontsize=size - 10, rotation = 90)
plt.yticks(fontsize=size -4)

plt.ylabel('Neue Fälle', fontsize=size)
plt.title('Neue Fälle pro Tag \n Stand: ' + today, fontsize=size)
plt.xlabel('Zeit', fontsize=size)

# Diagramm als Bild exporieren und Auflösung definieren
plt.savefig(pfad + name_4_1, dpi = 150, bbox_inches='tight')
plt.close()

###  4-2) Deaths 7 Tage Mittelwert Deutschland

In [103]:
# Größe im 16:9 format und mit Umrechnungsfaktor 1.2 (durch Test ermittelt) für PowerPoint angepasst
plt.figure(figsize=(16/1.5,9/1.5))

plt.style.use('seaborn')
plt.grid(True)

# Todesfälle pro 100.000 Einwohner 02.12.2020

plt.plot(ger.Date_reported,ger['MA_deaths'], 'b-', linewidth = lwb, label = "Deutschland\n(7-Tage Mittel)") # blau, linie, dick
plt.plot(ger.Date_reported,ger['New_deaths'], '.')

plt.plot(ger.Date_reported,ger['OTG_deaths'], 'r--', linewidth = lws, label ="+1 sigma")
plt.plot(ger.Date_reported,ger['UTG_deaths'], 'r--', linewidth = lws, label ="-1 sigma")

# Legende 
plt.legend(loc='center left', 
           bbox_to_anchor=(1, 0.5),
           fancybox=True, 
           shadow=True, 
           ncol=1, 
           fontsize=size)

# Schriftgrößen x und y achsenwerte
plt.xticks(fontsize=size - 10, rotation = 90)
plt.yticks(fontsize=size -4)
plt.ylabel('Todesfälle', fontsize=size)
plt.title('Todesfälle pro Tag - Deutschland  \n Stand: ' + today, fontsize=size)
plt.xlabel('Zeit', fontsize=size)

# Diagramm als Bild exporieren und Auflösung definieren
plt.savefig(pfad + name_4_2, dpi = 150, bbox_inches='tight')
plt.close()

## Performance messen

In [104]:
# performance
# pc = os.environ['COMPUTERNAME']
# now2 = datetime.now()
# print(f'performance {pc} = {now2-now} seconds')

In [105]:
# Performance
pc = os.environ['COMPUTERNAME']
now2 = datetime.now()

x = now2 - now
x = round(x.total_seconds(),2)

print(f'performance {pc} = {x} seconds')

performance DOUG = 2.95 seconds


In [106]:
# Performance CSV einlesen
d = pd.read_csv('df_performance_Führungskreis.csv')

In [107]:
# Neues Dateframe für die Performance definieren
now = datetime.now()

d2 = {'Date': [now],
      'PC': [pc],
      'Laufzeit_in_s': [x]}
#d2

In [108]:
# Datum Spalte formatieren
df2 = pd.DataFrame(d2)
df2['Date'] = df2['Date'].dt.strftime('%Y-%m-%d %r')

In [109]:
# Performance mit dem CSV verbinden
d = d.append(df2, ignore_index=True)
#d.head(3)

In [110]:
# Datenexport Performance
d.to_csv(r'D:\Github\Covid-19-Auswertung-WHO-DIVI\df_performance_Führungskreis.csv', index=False)

In [111]:
# Plot Performance
sns.set(rc={'figure.figsize':(16,9)})
sns_plot = sns.distplot(d['Laufzeit_in_s'],
            kde=True,
            rug=True,
            )
sns_plot.set_title('Performance plots Führungskreis',size=size)
sns_plot.set_ylabel('Wahrscheinlichkeit', size = size -5)
sns_plot.set_xlabel('Laufzeit [s]', size = size -5)
fig = sns_plot.get_figure()
fig.savefig(name_5) 
plt.close()