<a href="https://colab.research.google.com/github/WSzymczak23/projekty-SDA/blob/main/06_03_a_metryki_klasyfikacji.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Metryki klasyfikacji

Aby poznać popularne metody oceny klasyfikatorów wygenerujemy sobie przykładowe sekwencje klas przykładów. Wykorzystamy w tym celu bibliotekę numpy oraz generator liczb losowych z rozkładu normalnego.

In [None]:
import numpy as np

In [None]:
from numpy.random import RandomState

In [None]:
random = RandomState(30)

random_1 = random.normal(loc=0.0, size=200) #loc to średnia - maksimum krzywej gaussa
random_2 = random.normal(loc=0.5, size=200)
y_test = [1 if i >= 0 else 0 for i in random_1]  #tworzenie macierzy 0, 1
y_pred = [1 if i >= 0 else 0 for i in random_2]
print(y_test[:10])
print(y_pred[:10])

[0, 1, 0, 1, 0, 1, 0, 1, 1, 0]
[1, 1, 0, 1, 1, 0, 1, 0, 1, 0]


## Macierz błędów

Pierwszym krokiem będzie stworzenie macierzy błędów, czyli wyznaczenia true postives, true negatives, false positives i false negatives.

In [None]:
def confusion_matrix(truth, prediction):
    tp, tn, fp, fn = 0, 0, 0, 0
    for label, predicted in zip(truth, prediction):
        if label == predicted:
            if predicted:
                tp += 1
            else:
                tn += 1
        else:
            if predicted:
                fp += 1
            else:
                fn += 1
    return tp, tn, fp, fn

In [None]:
# zastosowanie dla 
confusion_matrix(y_test, y_pred)

(98, 60, 99, 43)

## Accuracy

Pierwszą miarą jest miara dokładności 

In [None]:
def accuracy(truth, prediction):
    tp, tn, fp, fn = confusion_matrix(truth, prediction)
    return (tp + tn) / (tp + tn + fp + fn)

Wynik dla analizowanych predykcji

In [None]:
accuracy(y_test, y_pred)

0.52

Z accuracy związany jest problem - zachowuje się źle przy niezbalansowanych zbiorach. Wygenerujemy zbiór, w którym większość przykładów będzie pozytywna.

In [None]:
# żeby większość była 1
random = RandomState(13)

random_3 = random.normal(loc=-1, scale=0.5, size=100)
y_extr = [1 if i >= 0 else 0 for i in random_3]
sum(y_extr)

3

In [None]:
y_extr[:20], len(y_extr)

([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0], 100)

Nasz "klasyfikator" ma stosunkowo niską dokładność.

In [None]:
accuracy(y_extr, y_pred)

0.38

Zakładając z góry, że wszystkie przykłady są pozytywne uzyskujemy bardzo wysoką dokładność. Takie zachowanie jest w wielu przypadkach niepożądane - przypuśćmy, że próbujemy stworzyć klasyfikator do komórek rakowych, gdzie większość przypadków jest negatywna - dla takiego podejścia, zwrócenie informacji że wszystkie przypadki są negatywne da bardzo wysoką dokładność.

In [None]:
accuracy(y_extr, 100 * [0])

0.97

## Recall

Ta miara z kolei mówi o tym, jaką część dodatnich wyników wykrył klasyfikator

In [None]:
def recall(truth, prediction):
    tp, tn, fp, fn = confusion_matrix(truth, prediction)
    return tp /(tp + fn)

In [None]:
recall(y_test, y_pred)

0.673469387755102

In [None]:
recall(y_extr, y_pred)

0.6666666666666666

In [None]:
recall(y_extr, 100 * [0])

0.0

In [None]:
recall(y_extr, 100 * [1])

1.0

In [None]:
accuracy(y_extr, 100 * [1])

0.03

## Precision

Jest to miara, która skupia się tylko na przykładach pozytywnych - mówi jaka część wyników wskazanych przez klasyfikator jako dodatnie jest rzeczywiście dodatnia.

In [None]:
def precision(truth, prediction):
    tp, tn, fp, fn = confusion_matrix(truth, prediction)
    return tp / (tp + fp)
    

In [None]:
precision(y_test, y_pred)

0.5238095238095238

In [None]:
precision(y_extr, y_pred)

0.031746031746031744

In [None]:
precision(y_extr, 100 * [1])

0.03

In [None]:
precision(y_extr, 100 * [0])

ZeroDivisionError: ignored

# F1 Score

Jest to średnia harmoniczna precyzji i czułości. Ogólnie - im wyższy F1-score tym lepszy jest klasyfikator.

In [None]:
def f1score(truth, prediction):
    prec = precision(truth, prediction)
    rec = recall(truth, prediction)
    return 2 * prec * rec / (prec + rec)

In [None]:
f1score(y_test, y_pred)

In [None]:
f1score(y_extr, y_pred)

In [None]:
f1score(y_extr, 100 * [1])

In [None]:
f1score(y_extr, 100 * [0])

Zadanie: Sprawdzamy analogiczne funkcje z modułu scikit-learn

In [None]:
from sklearn.metrics import f1_score

In [None]:
f1_score(y_test, y_pred)

In [None]:
f1_score(y_extr, y_pred)

In [None]:
f1_score(y_extr, 100 * [1])

In [None]:
f1_score(y_extr, 100 * [0])

zadanie

In [None]:
test_y =[0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0 , 0 , 0, 1]
pred_y =[0, 1, 1, 0, 0 , 0, 0, 1, 0, 0 , 0, 1, 1, 1, 0, 1]

In [None]:
from sklearn.metrics import precision_score, recall_score, confusion_matrix, accuracy_score, f1_score

In [None]:
confusion_matrix(test_y, pred_y)
confusion_matrix()

array([[6, 3],
       [3, 4]])

In [None]:
precision_score(test_y, pred_y)

0.5714285714285714

In [None]:
recall_score(test_y, pred_y)

0.5714285714285714

In [None]:
accuracy_score(test_y, pred_y)

0.625

In [None]:
f1_score(test_y, pred_y)

0.5714285714285714