# This is a sample Jupyter Notebook

Below is an example of a code cell. 
Put your cursor into the cell and press Shift+Enter to execute it and select the next one, or click !here goes the icon of the corresponding button in the gutter! button.
To debug a cell, press Alt+Shift+Enter, or click !here goes the icon of the corresponding button in the gutter! button.

Press Double Shift to search everywhere for classes, files, tool windows, actions, and settings.

To learn more about Jupyter Notebooks in PyCharm, see [help](https://www.jetbrains.com/help/pycharm/jupyter-notebook-support.html).
For an overview of PyCharm, go to Help -> Learn IDE features or refer to [our documentation](https://www.jetbrains.com/help/pycharm/getting-started.html).

In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.metrics import f1_score
from sklearn.metrics import recall_score
from sklearn.metrics import jaccard_score
from sklearn.metrics import confusion_matrix



## Questions arise: ##
- Accuracy of Model: (accuracy, f1 score(recall ACC), jquard-index..etc)
- Improvements in the doctor's diagnosis after using AI.
- Patterns in cases where AI disagrees with the ideal answer (e.g., certain fracture types that are harder to detect).
- Influence of AI recommendations on procedure changes (positive or negative impact when diagnosis changes based on AI).
- Instances where the doctor disagrees with both the ideal answer and AI's prediction.
- Instances where AI disagrees with the doctor.

**Final Question**: 
- Do doctors trust AI, and how effective is it in aiding their diagnosis?

  

In [5]:
raw_patients = pd.read_excel('patients.xlsx')
raw_patients.columns

Index(['Datum', 'Unnamed: 1', 'Patient\n(Initialen/Geburtsdat.)', 'Unnamed: 3',
       'Diagnose Arzt vor KI', 'Unnamed: 5', 'Unnamed: 6', 'Befund KI',
       'Unnamed: 8', 'Unnamed: 9', 'Diagnose Arzt nach KI', 'Unnamed: 11',
       'Unnamed: 12', 'Änderung der Diagnose', 'Unnamed: 14', 'Unnamed: 15',
       'Therapie vor KI', 'Unnamed: 17', 'Unnamed: 18', 'Therapie nach KI',
       'Unnamed: 20', 'Änderung der Maßnahme\nnein/ja (In wie fern?)',
       'Unnamed: 22', 'Ausbildungsjahr\n', 'Unnamed: 24',
       'Befund der Kinderradiologen'],
      dtype='object')

In [6]:
raw_patients.head()

Unnamed: 0,Datum,Unnamed: 1,Patient\n(Initialen/Geburtsdat.),Unnamed: 3,Diagnose Arzt vor KI,Unnamed: 5,Unnamed: 6,Befund KI,Unnamed: 8,Unnamed: 9,...,Therapie vor KI,Unnamed: 17,Unnamed: 18,Therapie nach KI,Unnamed: 20,Änderung der Maßnahme\nnein/ja (In wie fern?),Unnamed: 22,Ausbildungsjahr\n,Unnamed: 24,Befund der Kinderradiologen
0,,,,,keine Fraktur,,,No fracture,,,...,Voltarenverband,,,Voltarenverband,,nein,,5,,"Keine Fraktur,\nPatella Wiberg 2"
1,,,,,isolierte Ulnaschaftfraktur\n (Grünholzfraktur),,,high suspicion fracture,,,...,Oberarm-Gips+ Kontrolle,,,Oberarm-Gips+ Kontrolle,,nein,,5,,Ulnaschaftfraktur
2,,,,,dislozierte Fraktur D5 links\n am Kopf des Gru...,,,"High suspicion fracture, \naber hat Dislokatio...",,,...,Finger-Taping IV. und V links,,,",,",,nein,,8,,dislozierte Fraktur des Köpchens\n der Grundph...
3,,,,,keine Fraktur,,,no fracture,,,...,Voltarenverband,,,",,",,nein,,N?,,Keine Fraktur
4,,,,,keine Fraktur,,,low suspicion fracture,,,...,"trotzdem Gipsschiene, \nweil dies der 2. Stoß ...",,,",,",,nein,,5,,Kein Frakturnahcweis


In [8]:
raw_patients = raw_patients[['Diagnose Arzt vor KI', 'Befund KI', 'Diagnose Arzt nach KI', 'Änderung der Diagnose', 'Befund der Kinderradiologen']]
raw_patients.head()

Unnamed: 0,Diagnose Arzt vor KI,Befund KI,Diagnose Arzt nach KI,Änderung der Diagnose,Befund der Kinderradiologen
0,keine Fraktur,No fracture,keine Fraktur,nein,"Keine Fraktur,\nPatella Wiberg 2"
1,isolierte Ulnaschaftfraktur\n (Grünholzfraktur),high suspicion fracture,isolierte Ulnaschaftfraktur,nein,Ulnaschaftfraktur
2,dislozierte Fraktur D5 links\n am Kopf des Gru...,"High suspicion fracture, \naber hat Dislokatio...",dislozierte Fraktur D5 links\n am Kopf des Gru...,nein,dislozierte Fraktur des Köpchens\n der Grundph...
3,keine Fraktur,no fracture,keine Fraktur,nein,Keine Fraktur
4,keine Fraktur,low suspicion fracture,keine Fraktur,nein,Kein Frakturnahcweis


In [10]:
for col in raw_patients.columns:
   print(raw_patients[col].value_counts())

Diagnose Arzt vor KI
keine Fraktur                                                              41
Clavicula Fraktur                                                           2
keien Fraktur                                                               2
keine Fraktur,\nOssifikationszentrum nicht sichtbar,\n--> US                1
Radiuswulsfraktur rechts                                                    1
Radiuswulstfraktur                                                          1
keine eindeutige Fraktur,\nV.a. Fraktur am distalen Radius                  1
V.a. Fraktur am Grundphalanx                                                1
V.a. Radiusfraktur links distal                                             1
V.a. Längsfraktur am Grundphalanx D5 links DD Gefäßkanal im Knochen         1
V.a. Längsfraktur an der Ulna                                               1
Fraktur an der Basis des Mittelphalanx D2 links                             1
keine Fraktur, aber unsicher               

In [11]:
negativ = ['keine','keien','Keine','no','No','nein','Kein','kein']
raw_patients.replace(negativ, 0, regex=True, inplace=True)
#Make sure there are no negative words left
for col in raw_patients.columns:
   print(f"column: {col}")
   print(raw_patients[col].value_counts())

Diagnose Arzt vor KI
0                                                                 59
Clavicula Fraktur                                                  2
Fraktur an der Basis des Mittelphalanx D2 links                    1
komplette UA-Schaftfraktur                                         1
distale Radiusfraktur (unsicher),\n                                1
Radiuswulsfraktur rechts                                           1
Radiuswulstfraktur                                                 1
V.a. Fraktur am Grundphalanx                                       1
V.a. Radiusfraktur links distal                                    1
V.a. Längsfraktur an der Ulna                                      1
Wulsfraktur am distalen Radius                                     1
V.a. Fraktur am distalen Femur wegen Fett-pads                     1
UA-Schaftfraktur v.a prox. Radius + distale Ulna                   1
dislozierte komplette distale UA-Fraktur                           1
Fraktur D3, D

In [14]:
binary_list = (raw_patients != 0)
binary_list = binary_list.astype(int)
patients = pd.DataFrame(binary_list)
patients.head()

Unnamed: 0,Diagnose Arzt vor KI,Befund KI,Diagnose Arzt nach KI,Änderung der Diagnose,Befund der Kinderradiologen
0,0,0,0,0,0
1,1,1,1,0,1
2,1,1,1,0,1
3,0,0,0,0,0
4,0,1,0,0,0
