In [None]:
import pandas as pd
import os
import json
import httpx

from src.download.patients import PatientsDownload
from src.download.covid_downloader import CovidDataDownloader
from src.geolocation.address_transformation import get_landkreis_id_from_postal_code


### Use Case: Von einer Datei alle Patienten extrahieren und für einzelne Patienten Covid-Daten anschauen

In [None]:
# INPUT from the User Interface 
START_DATE = input("Bitte geben Sie den Startzeitpunkt der Datenabfrage ein (Format: YYYY-MM-DD): ")
END_DATE = input("Bitte geben Sie den Endzeitpunkt der Datenabfrage ein (Format: YYYY-MM-DD): ")

In [None]:
# Load Patient Data - test data
file = open("data/raw/2024-12-02_mii_testdaten_small.json")
data = json.load(file)

In [None]:
# Extract Patients from Data + select an interesting patient
patients = PatientsDownload()
patients.extract_patients(data = data)
interesting_patient = patients.get_patient_by_id("595")

In [None]:
covid_data = CovidDataDownloader()
return_data = covid_data.get_coviddata_patient(patient = interesting_patient, start_date = START_DATE, end_date = END_DATE)

In [None]:
return_data.head()

In [None]:
return_data[["Altersgruppe", "Geschlecht"]].value_counts()

In [None]:
# Gesamtanzahl der Fälle # todo: bereinigung mitnehmen?
print(f"Die Gesamtanzahl an Fällen im Zeitraum {START_DATE} bis {END_DATE} beträgt {str(return_data['AnzahlFall'].sum())}")

In [None]:
return_data.groupby("Meldedatum").size().plot()

In [None]:
# Gesamtanzahl Todesfälle
print(f"Die Gesamtanzahl an Todesfällen im Zeitraum {START_DATE} bis {END_DATE} beträgt {str(return_data['AnzahlTodesfall'].sum())}")


In [None]:
# Gesamtanzahl genese Fälle
print(f"Die Gesamtanzahl an Genesenen im Zeitraum {START_DATE} bis {END_DATE} beträgt {str(return_data['AnzahlGenesen'].sum())}")

### Use Case: Von einer Datei alle Patienten extrahieren und für einzelne Patient:innen Covi-Daten anschauen mit Filterung nach Geschlecht und/oder Alter

In [None]:
# INPUT from the User Interface 
START_DATE = input("Bitte geben Sie den Startzeitpunkt der Datenabfrage ein (Format: YYYY-MM-DD): ")
END_DATE = input("Bitte geben Sie den Endzeitpunkt der Datenabfrage ein (Format: YYYY-MM-DD): ")

In [None]:
# Load Patient Data - test data
file = open("data/raw/2024-12-02_mii_testdaten_small.json")
data = json.load(file)

In [None]:
# Extract Patients from Data + select an interesting patient
patients = PatientsDownload()
patients.extract_patients(data = data)
interesting_patient = patients.get_patient_by_id("595")

In [None]:
# filter for age group
covid_data = CovidDataDownloader()
return_data = covid_data.get_coviddata_patient(filter_age = True, patient = interesting_patient, start_date = START_DATE, end_date = END_DATE)
return_data["Altersgruppe"].value_counts()

In [None]:
# filter for gender
covid_data = CovidDataDownloader()
return_data = covid_data.get_coviddata_patient(filter_gender = True, patient = interesting_patient, start_date = START_DATE, end_date = END_DATE)
return_data["Geschlecht"].value_counts()

In [None]:
# filter for gender and age
covid_data = CovidDataDownloader()
return_data = covid_data.get_coviddata_patient(filter_gender = True, filter_age = True, patient = interesting_patient, start_date = START_DATE, end_date = END_DATE)
return_data[["Altersgruppe", "Geschlecht"]].value_counts()

### Use Case: Von einer Datei alle Patienten extrahieren und für alle Patient:innen Covid-Daten anschauen

In [None]:
# INPUT from the User Interface 
START_DATE = input("Bitte geben Sie den Startzeitpunkt der Datenabfrage ein (Format: YYYY-MM-DD): ")
END_DATE = input("Bitte geben Sie den Endzeitpunkt der Datenabfrage ein (Format: YYYY-MM-DD): ")

In [None]:
# Load Patient Data - test data
file = open("data/raw/2024-12-02_mii_testdaten_small.json")
data = json.load(file)

In [None]:
# Extract Patients from Data + select an interesting patient
patients = PatientsDownload()
patients.extract_patients(data = data)
interesting_patient = patients.get_patient_by_id("595")

In [None]:
covid_data = CovidDataDownloader()
return_data = covid_data.get_coviddata_patient(filter_gender = True, filter_age = True, patient = interesting_patient, start_date = START_DATE, end_date = END_DATE)

In [None]:
return_data

### Use Case: Von einer Datei alle Patienten extrahieren und für alle Patient:innen Covid-Daten anschauen mit Filter nach Geschlecht und Alter

In [None]:
# INPUT from the User Interface 
START_DATE = input("Bitte geben Sie den Startzeitpunkt der Datenabfrage ein (Format: YYYY-MM-DD): ")
END_DATE = input("Bitte geben Sie den Endzeitpunkt der Datenabfrage ein (Format: YYYY-MM-DD): ")

In [None]:
# Load Patient Data - test data
file = open("data/raw/2024-12-02_mii_testdaten_large.json")
data = json.load(file)

In [None]:
# Extract Patients from Data + select an interesting patient
patients = PatientsDownload()
patients.extract_patients(data = data)

covid_data = CovidDataDownloader()

In [None]:
# filter for gender
return_data = covid_data.get_coviddata_patient_collection(filter_gender= True, patients = patients.patients, start_date = START_DATE, end_date=END_DATE)

In [None]:
patient_data = return_data[return_data["patient_id"] == "longcovid-patient-2"]

In [None]:
patient_data["Geschlecht"].value_counts() # only female covid data