## Phase 5 (Evaluation)

* Autorin: Anna (i3-Versicherung)
* Webseite: [Data Science Training - Kapitel 20](https://data-science.training/kapitel-20/)
* Datum: 23.03.2023

Datenversion: 9

Methode: Gradient Boosting (GB)

Optimierung: Ergebnis von Halving Random Search (HRS)

Schwellenwerte: 0.70, 0.75, 0.80, 0.85, 0.90

In [4]:
# Pandas Paket (Package) importieren
#  Datenstrukturen und Datenanalyse, I/O
#  https://pandas.pydata.org/pandas-docs/stable/
import pandas as pd
# NumPy Paket (Package) importieren
#  Mehrdimensionale Datenstrukturen (Vektoren, Matrizen, Tensoren, Arrays), Lineare Algebra
#  https://numpy.org/doc/
import numpy as np
# Pickle Paket (Package) importieren
#  Objekte serialisieren
#  https://docs.python.org/3/library/pickle.html
import pickle as pk

In [5]:
# Datenversion festlegen: 9
version   = 9
# Modell-Abkürzung festlegen: gb = Gradient Boosting
shortcut  = 'gb'
# Optimierungsart festlegen: hrs = Halving Random Search
opt       = 'hrs'
# Optimalen Schwellenwert festlegen: 0.70, 0.75, 0.80, 0.85, 0.90
threshold = 0.90

In [6]:
# Testdaten als Pandas Data Frame (df) aus Excel-Datei laden
#  (KNIME: "Excel Reader")
filename = '../../data/titanic/new/test_v' + str(version) + '.xlsx'
df_test  = pd.read_excel(filename)

In [7]:
# Modell laden
#  (KNIME: "PMML Reader")
filename = '../../models/titanic/new/' + shortcut + '_v' + str(version) + '_' + opt + '_thr_' + str(threshold)
model = pk.load(open(filename, 'rb'))

In [8]:
# Testdaten: Daten ohne PassengerId extrahieren
X_test = df_test.iloc[:,1:].values

In [9]:
# Wahrscheinlichkeiten bestimmen
#  (KNIME: "XYZ Predictor")
y_prob = model.predict_proba(X_test)

In [10]:
# Prognosen aus den Klassen-Wahrscheinlichkeiten mittels Schwellenwert berechnen
def dst_predictions(y_prob, threshold=0.5):
    m = len(y_prob[:,1])
    y_pred = np.zeros(m)
    for k in range(0, m):
        if y_prob[k][1] > threshold:
            y_pred[k] = 1
    return y_pred

In [11]:
# Prognosen berechnen
#  (KNIME: "XYZ Predictor")
y_pred = dst_predictions(y_prob, threshold)

In [12]:
# Ergebnisse in das Data Frame kopieren
df_test['Survived'] = y_pred
df_test['ProbN']    = y_prob[:,0]
df_test['ProbP']    = y_prob[:,1]

In [13]:
# Relevante Ergebnisse filtern
#  (KNIME: "Column Filter")
df_res = df_test.filter(['PassengerId', 'Survived', 'ProbN', 'ProbP'])

In [14]:
# Ergebnisse als CSV-Datei speichern
#  (KNIME: "CSV Writer")
filename = '../../data/titanic/submission/' + shortcut + '_v' + str(version) + '_' + opt + '_thr_' + str(threshold) + '.csv'
df_res.to_csv(filename, index=False)

In [15]:
# Ergebnis-Datei auf Webseite hochladen
# https://data-science.training/upload/

### Ergebnisse (Gütemaße)

#### Schwelle = 0,70

* Genauigkeit 	(Accuracy) 	: 	75,84 	%
* Spezifität 	(Specificity) 	: 	93,08 	%
* Sensitivität 	(Sensitivity) 	: 	47,47 	%
* Präzision 	(Precision) 	: 	80,65 	%
* Recall 	(Recall) 	: 	47,47 	%
* F-Maß 	(F1 Score) 	: 	59,76 	%
* AURC 	(AURC) 	: 	82,35 	%
* LogLoss 	(LogLoss) 	: 	0,487

#### Schwelle = 0,75

* Genauigkeit 	(Accuracy) 	: 	76,56 	%
* Spezifität 	(Specificity) 	: 	95,38 	%
* Sensitivität 	(Sensitivity) 	: 	45,57 	%
* Präzision 	(Precision) 	: 	85,71 	%
* Recall 	(Recall) 	: 	45,57 	%
* F-Maß 	(F1 Score) 	: 	59,50 	%
* AURC 	(AURC) 	: 	82,35 	%
* LogLoss 	(LogLoss) 	: 	0,487

#### Schwelle = 0,80

* Genauigkeit 	(Accuracy) 	: 	76,56 	%
* Spezifität 	(Specificity) 	: 	97,69 	%
* Sensitivität 	(Sensitivity) 	: 	41,77 	%
* Präzision 	(Precision) 	: 	<span style="color:red">91,67 	%</span>
* Recall 	(Recall) 	: 	41,77 	%
* F-Maß 	(F1 Score) 	: 	57,39 	%
* AURC 	(AURC) 	: 	82,35 	%
* LogLoss 	(LogLoss) 	: 	0,487

#### Schwelle = 0,85

* Genauigkeit 	(Accuracy) 	: 	72,97 	%
* Spezifität 	(Specificity) 	: 	98,08 	%
* Sensitivität 	(Sensitivity) 	: 	31,65 	%
* Präzision 	(Precision) 	: 	<span style="color:red">90,91 	%</span>
* Recall 	(Recall) 	: 	31,65 	%
* F-Maß 	(F1 Score) 	: 	46,95 	%
* AURC 	(AURC) 	: 	82,35 	%
* LogLoss 	(LogLoss) 	: 	0,487

#### Schwelle = 0,90

* Genauigkeit 	(Accuracy) 	: 	71,05 	%
* Spezifität 	(Specificity) 	: 	99,23 	%
* Sensitivität 	(Sensitivity) 	: 	24,68 	%
* Präzision 	(Precision) 	: 	<span style="color:red">95,12 	%</span>
* Recall 	(Recall) 	: 	24,68 	%
* F-Maß 	(F1 Score) 	: 	39,20 	%
* AURC 	(AURC) 	: 	82,35 	%
* LogLoss 	(LogLoss) 	: 	0,487
