# Übung Syntaktische & Semantische Interoperabilität

In [None]:
# Installation (ggf. nach ersten Lauf auskommentieren)
#!pip install folium
#!pip install altair

# Libraries
import numpy
import pandas as pd
import folium
from folium.plugins import MarkerCluster
import altair as alt

# Konfiguration
base_url = "https://raw.githubusercontent.com/ganslats/interoperability-excercise/main/data"

## Patientenstammdaten

In [None]:
# Patientenstammsätze laden
patients_mannheim = pd.read_csv(base_url + "/Mannheim/patients.csv", index_col=0)
patients_leipzig  = pd.read_csv(base_url + "/Leipzig/patients.csv",  index_col=0)

# Patientenstammsätze zusammenführen
patients = pd.concat([patients_mannheim, patients_leipzig])

# Karte mit Fokus Bundesgebiet erzeugen
map = folium.Map(location=[51.151509, 10.217850], zoom_start=6)
marker_cluster = MarkerCluster().add_to(map)

# Patientenlokalisationen hinzufügen
for row in patients.itertuples():
    folium.Marker(location=[row.LAT,row.LON]).add_to(marker_cluster)

# Karte anzeigen
map

## Aufgabe 1: Befunddaten laden & anzeigen

* Laden Sie die Hämoglobin-Befunddaten für Leipzig und Mannheim
* Ergänzen Sie jeweils den Ortsnamen in einer zusätzlichen Spalte "ORT"
* Geben Sie beide Dataframes aus

## Aufgabe 2: Mappingtabelle erstellen, um beide Datensätze zusammenzuführen

* Vergleichen Sie die Spalten beider Quelldatensätze
* Erstellen sie ein Mapping, mit dem Sie die Spaltenbezeichner des Mannheimer Datensatzes auf die Vorlage des Leipziger Datensatzes anpassen
* Führen Sie beide Quelldatensätze in einem gemeinsamen Dataframe zusammen
* Geben Sie den zusammengeführten Dataframe aus

## Aufgabe 3: Zusammengeführte Befunddaten visualisieren

* Generieren Sie einen Boxplot der Hämoglobinwerte nach Standort
* Prüfen Sie, ob die Verteilungen voneinander abweichen

## Aufgabe 4: Mapping für harmonisierte Semantische Codierung & Wertebereiche erstellen

* Recherchieren Sie LOINC-Codes für Hämoglobin auf https://search.loinc.org/ (kostenfreier Account notwendig)
* Recherchieren Sie den Umrechnungsfaktor zwischen den an beiden Standorten verwendeten Maßeinheiten für Hämoglobin
* Erstellen sie ein Dataframe mit einem Mapping, das ausgehend von den Labormethoden-IDs der Quelldatensätze folgende Attribute hinzufügt:
    * LOINC-Code
    * LOINC-Name
    * Deutschsprachigen Namen
    * einheitliche Maßeinheit
    * Multiplikator, um vom Quellwert auf die ggf. abweichende Maßeinheit umzurechnen
* Geben Sie die Mappingtabelle aus

## Aufgabe 5: Mapping anwenden und harmonisierte Befunddaten visualisieren

* Wenden Sie die Mappingtabelle auf die zusammengeführten Befunddaten an, um zusätzliche Spalten mit den harmonisierten Methodenangaben und Befunddaten zu ergänzen
* Generieren Sie erneut einen Boxplot der Hämoglobinwerte nach Standort
* Prüfen Sie, ob die Verteilungen jetzt einheitlich sind