<a href="https://colab.research.google.com/github/davidofitaly/machine-learning-notes/blob/main/supervised/03_classification/08_metrics.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

###import of libraries

In [1]:
import numpy as np
import pandas as pd
import plotly.graph_objects as go
import plotly.express as px
from plotly.subplots import make_subplots

###Metrics - binary classification

###Accuracy - Accuracy of classification

In [2]:
y_true = np.array([1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1])
y_pred = np.array([0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1])

In [3]:
from sklearn.metrics import accuracy_score

accuracy_score(y_true, y_pred)

0.8

In [4]:
results = pd.DataFrame(data={'y_true': y_true, 'y_pred': y_pred})

results

Unnamed: 0,y_true,y_pred
0,1,0
1,0,0
2,1,1
3,1,1
4,0,0
5,1,1
6,1,0
7,0,0
8,1,1
9,0,1


In [5]:
results = results.sort_values(by='y_true')
results = results.reset_index(drop=True)
results['sample'] = results.index + 1
results

Unnamed: 0,y_true,y_pred,sample
0,0,0,1
1,0,0,2
2,0,0,3
3,0,0,4
4,0,0,5
5,0,0,6
6,0,0,7
7,0,0,8
8,0,1,9
9,0,1,10


In [6]:
fig = make_subplots(rows=2, cols=1)

fig.add_trace(go.Scatter(x=results['sample'], y=results['y_true'], mode='markers', name='y_true'), row=1, col=1)
fig.add_trace(go.Scatter(x=results['sample'], y=results['y_pred'], mode='markers', name='y_pred'), row=2, col=1)
fig.update_layout(width=800, height=600, title='Binary of classification')
fig.show()

###Confusion/confusion matrix

In [7]:
from sklearn.metrics import confusion_matrix

cm = confusion_matrix(y_true, y_pred)
cm


array([[ 8,  2],
       [ 4, 16]])

In [8]:
import plotly.figure_factory as ff

def plot_confusion_matrix(cm):
    cm = cm[::-1]
    cm = pd.DataFrame(cm, columns=['pred_0', 'pred_1'], index=['true_1', 'true_0'])

    fig = ff.create_annotated_heatmap(z=cm.values, x=list(cm.columns), y=list(cm.index),
                                      colorscale='ice', showscale=True, reversescale=True)
    fig.update_layout(width=400, height=400, title='Confusion Matrix', font_size=16)
    fig.show()

plot_confusion_matrix(cm)

In [9]:
cm = confusion_matrix(y_true, y_pred)
cm_df = pd.DataFrame(cm, columns=['pred_0', 'pred_1'], index=['true_0', 'true_1'])
cm_df

Unnamed: 0,pred_0,pred_1
true_0,8,2
true_1,4,16


- TN (True Negative): Kiedy rzeczywista klasa to 0 i przewidywana klasa to 0 (pierwsza pozycja: [0, 0]). Liczba przykładów, które są rzeczywiście negatywne i zostały poprawnie sklasyfikowane jako negatywne.

- FP (False Positive - błąd typu I): Kiedy rzeczywista klasa to 0, ale przewidywana klasa to 1 (druga pozycja: [0, 1]). Liczba przykładów, które są rzeczywiście negatywne, ale zostały błędnie sklasyfikowane jako pozytywne.

- FN (False Negative - błąd typu II): Kiedy rzeczywista klasa to 1, ale przewidywana klasa to 0 (trzecia pozycja: [1, 0]). Liczba przykładów, które są rzeczywiście pozytywne, ale zostały błędnie sklasyfikowane jako negatywne.

- TP (True Positive): Kiedy rzeczywista klasa to 1 i przewidywana klasa to 1 (czwarta pozycja: [1, 1]).  Liczba przykładów, które są rzeczywiście pozytywne i zostały poprawnie sklasyfikowane jako pozytywne.

In [10]:
data = [
    {'pred_0': 'TN', 'pred_1': 'FP'},
    {'pred_0': 'FN', 'pred_1': 'TP'}

]

cm_note = pd.DataFrame(data, columns=['pred_0', 'pred_1'], index=['true_0', 'true_1'])
cm_note

Unnamed: 0,pred_0,pred_1
true_0,TN,FP
true_1,FN,TP


In [12]:
tn, fp, fn, tp = cm.ravel()

print(f'TN - True Negative: {tn}')
print(f'FP - False Positive: {fp}')
print(f'FN - False Negative: {fn}')
print(f'TP - True Positive: {tp}')

TN - True Negative: 8
FP - False Positive: 2
FN - False Negative: 4
TP - True Positive: 16


False Positive Rate (FPR) - Type I error. Mierzy odsetek przypadków, które były negatywne, ale zostały błędnie sklasyfikowane jako pozytywne.

In [13]:
fpr = fp / (fp + tn)
fpr

0.2

False Negative Rate (FNR) - Type II error. Mierzy odsetek przypadków, które były pozytywne, ale zostały błędnie sklasyfikowane jako negatywne.

In [14]:
fnr = fn / (fn + tp)

fnr

0.2

Precision - Wysoka wartość precyzji oznacza, że model rzadko klasyfikuje negatywne przypadki jako pozytywne. Innymi słowy, kiedy model mówi "to jest pozytywne", to zazwyczaj ma rację.

In [15]:
precision = tp / (tp + fp)

precision

0.8888888888888888

Recall (czułość - true positive rate) to miara używana w klasyfikacji binarnej, która wskazuje, jak dobrze model identyfikuje pozytywne przypadki. Mówi nam, jaki procent rzeczywistych pozytywnych przypadków został poprawnie przewidziany przez model.

In [17]:
recall = tp / (tp + fn)

recall

0.8

In [18]:
from sklearn.metrics import classification_report

print(classification_report(y_true, y_pred))

              precision    recall  f1-score   support

           0       0.67      0.80      0.73        10
           1       0.89      0.80      0.84        20

    accuracy                           0.80        30
   macro avg       0.78      0.80      0.78        30
weighted avg       0.81      0.80      0.80        30



###ROC Curve

In [20]:
from sklearn.metrics import roc_curve

fpr, tpr, tresh = roc_curve(y_true, y_pred, pos_label=1)

roc = pd.DataFrame({'fpr': fpr, 'tpr': tpr})
roc

Unnamed: 0,fpr,tpr
0,0.0,0.0
1,0.2,0.8
2,1.0,1.0


In [24]:
def plot_roc_curve(y_true, y_pred):
    fpr, tpr, tresh = roc_curve(y_true, y_pred, pos_label=1)

    fig = go.Figure(
        data = [
            go.Scatter(x=roc['fpr'], y=roc['tpr'],
                       line_color='red',
                       name='ROC Curve'),
            go.Scatter(x=[0,1], y=[0,1],
                       mode='lines',
                       line_dash='dash',
                       line_color='navy')
        ]
    )

    fig.show()

plot_roc_curve(y_true, y_pred)


###Metrics - Multi-class classification

In [25]:
y_true = np.array([1, 0, 1, 2, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 2, 1, 1, 2, 2, 1, 0, 1, 1, 0, 2, 1, 1, 2, 2])
y_pred = np.array([0, 0, 1, 2, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 2, 1, 2, 1, 2, 1, 0, 2, 1, 0, 1, 1, 1, 2, 2])

from sklearn.metrics import accuracy_score

accuracy_score(y_true, y_pred)

0.7241379310344828

###Confusion/confusion matrix

In [26]:
cm = confusion_matrix(y_true, y_pred)
cm

array([[ 6,  1,  0],
       [ 3, 10,  2],
       [ 0,  2,  5]])

In [27]:
def plot_confusion_matrix(cm):
    cm = cm[::-1]
    cm = pd.DataFrame(cm, columns=['pred_0', 'pred_1', 'pred_2'], index=['true_2','true_1', 'true_0'])

    fig = ff.create_annotated_heatmap(z=cm.values, x=list(cm.columns), y=list(cm.index),
                                      colorscale='ice', showscale=True, reversescale=True)
    fig.update_layout(width=400, height=400, title='Confusion Matrix', font_size=16)
    fig.show()

plot_confusion_matrix(cm)

###Classification report

In [28]:
from sklearn.metrics import classification_report

print(classification_report(y_true, y_pred))

              precision    recall  f1-score   support

           0       0.67      0.86      0.75         7
           1       0.77      0.67      0.71        15
           2       0.71      0.71      0.71         7

    accuracy                           0.72        29
   macro avg       0.72      0.75      0.73        29
weighted avg       0.73      0.72      0.72        29



In [29]:
print(classification_report(y_true, y_pred, target_names=['label_1', 'label_2', 'label_3']))

              precision    recall  f1-score   support

     label_1       0.67      0.86      0.75         7
     label_2       0.77      0.67      0.71        15
     label_3       0.71      0.71      0.71         7

    accuracy                           0.72        29
   macro avg       0.72      0.75      0.73        29
weighted avg       0.73      0.72      0.72        29

