In [None]:
import os
import json

from src.download.patients import PatientsDownload
from src.download.rehabilitation_downloader import RehabilitationDownloader


# Info: 
Dieses Skript arbeitet mit den Reha Daten von dem Reha-Einrichtungsverzeichnis der BAR. Es werden folgende Use Cases abgedeckt:

1) Für einzelne Patient:innen Rehabilitations-Angebote mit Post-Covid Spezialisierung anschauen
2) Für mehrere Patient:innen Rehabilitations-Angebote mit Post-Covid Spezialisierung anschauen mit zwei Forschungsfragen-Ideen: 
    - Wie weit entfernt ist das nächste Reha-Angebot von den Patient:innen im Durschschnitt entfernt?
    - Welches Reha-Angebot ist am nächsten für die meisten Patient:innen?

Dabei werden immer die nächsten Rehabilitations-Angebote (berechnet mit Hilfe der Postleitzahl und Breitengrad, Längengrad) zurückgegeben.

### 1) Use Case: Von einer Datei alle Patient:innen extrahieren und für enzelne Patient:innen das nächste Rehabilitations-Angebot anschauen

In [None]:
# Load Patient Data - test data
with open("data/raw/2024-12-02_mii_testdaten_small.json", 'r') as file:
    data = json.load(file)

In [None]:
# Extract Patients from Data + select an interesting patient
patients = PatientsDownload()
patients.extract_patients(data = data)
interesting_patient = patients.get_patient_by_id("595")

In [None]:
rehabilitation_data = RehabilitationDownloader()
return_data = rehabilitation_data.get_rehabilitation_data_patient(interesting_patient)

In [None]:
return_data

### 2) Use Case: über mehrere Patient:innen loopen und einen Datensatz für alle

In [None]:
# Load Patient Data - test data
with open("data/raw/2024-12-02_mii_testdaten_large.json", 'r') as file:
    data = json.load(file)

In [None]:
patients = PatientsDownload()
patients.extract_patients(data = data)

rehabilitation_data = RehabilitationDownloader()
return_data = rehabilitation_data.get_rehabilitation_data_patient_collection(patients = patients.patients)

In [None]:
return_data.head()

In [None]:
# Forschungsfrage: Wie weit ist das nächste Reha-Angebot von den Patient:innen im Durschschnitt entfernt?
str(round(return_data["distance"].mean(), 2)) + " km"

In [None]:
# Forschungsfrage: Welches Reha-Angebot ist am nächsten für die meisten Patient:innen?
return_data["reha_station_short"].value_counts().idxmax()