In [None]:
import os 
import json
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

from src.download.patients import PatientsDownload
from src.download.clinic_downloader import ClinicDownloader

# Info: 
Dieses Skript arbeitet mit den Klinik Daten von der BMG Initiative Long Covid (https://www.bmg-longcovid.de/service/buergertelefon-und-regionale-kliniksuche). Es werden folgende Use Cases abgedeckt:

1) Für einzelne Patient:innen Kliniken mit Post-Covid Spezialisierung anschauen
2) Für mehrere Patient:innen Kliniken mit Post-Covid Spezialisierung anschauen mit zwei Forschungsfragen-Ideen: 
    - Wie weit entfernt ist die nächste Klinik von den Patient:innen im Durschschnitt entfernt?
    - Welche Klinik ist am nächsten für die meisten Patient:innen?

Dabei werden immer die nächsten Kliniken (berechnet mit Hilfe der Postleitzahl und Breitengrad, Längengrad) zurückgegeben.

### 1) Use Case: Von einer Datei alle Patient:innen extrahieren und für einzelne Patient:innen Kliniken mit Post-Covid Spezialisierung anschauen

In [None]:
# Load Patient Data - test data
with open("data/raw/2024-12-02_mii_testdaten_small.json", 'r') as file:
    data = json.load(file)

In [None]:
# Extract Patients from Data + select an interesting patient
patients = PatientsDownload()
patients.extract_patients(data = data)
interesting_patient = patients.get_patient_by_id("595")

In [None]:
clinic_data = ClinicDownloader()
return_data = clinic_data.get_clinic_data_patient(interesting_patient)

In [None]:
return_data.head()

### 2) Use Case: über mehrere Patient:innen loopen und einen Datensatz für alle

In [None]:
# Load Patient Data - test data
with open("data/raw/2024-12-02_mii_testdaten_large.json", 'r') as file:
    data = json.load(file)

In [None]:
patients = PatientsDownload()
patients.extract_patients(data = data)

clinic_data = ClinicDownloader()
return_data = clinic_data.get_clinic_data_patient_collection(patients = patients.patients)

In [None]:
return_data["name"].value_counts()

In [None]:
# Forschungsfrage: Wie weit entfernt ist die nächste Klinik von den Patient:innen im Durschschnitt entfernt?
str(round(return_data["distance"].mean(), 2)) + " km"

In [None]:
# Forschungsfrage: Welche Klinik ist am nächsten für die meisten Patient:innen?
return_data["name"].value_counts().idxmax()