# Ocena klasyfikatorów binarnych

### Wprowadzenie 
Wynikiem pracy klasyfikatorów binarnych jest zwrócenie w odpowiedzi na zadany wektor cech jednej z dwóch wartości (np. prawda-fałsz, 0-1 itd.). Porównując odpowiedź klasyfikatora z rzeczywistą etykietą testowego zestawu cech, możemy uzyskać jedną z czterech możliwości:
- algorytm poprawnie przewidział wartość prawdziwą (true positive hit / TP),
- algorytm poprawnie przewidział wartość fałszywą (true negative hit / TN),
- algorytm niepoprawnie przewidział wartość prawdziwą (false positive / FP / false alarm / Type I error),
- algorytm niepoprawnie przewidział wartość fałszywą (false negative / FN / with miss / Type II error).
Porządaną sytuacją jest maksymalizacja wyników dla których algorytm poprawnie przewiduje wartości prawdy i fałszu (a więc dwie pierwsze sytuacje z powyższej listy).

### Stosowane miary

1. Czułość i specyficzność:
- czułość (true positive rate - TPR): prawdopodobieństwo klasyfikacji poprawnej pod warunkiem, że przypadek jest pozytywny <br>
$TPR = \frac{TP}{P} = \frac{TP}{TP+FN}$
- specyficzność (true negative rate - TNR): prawdopodobieństwo klasyfikacji poprawnej pod warunkiem, że przypadek jest negatywny <br>
$TNR = \frac(TN){N} = \frac{TN}{TN+FP}$

2. Fałszywe alarmy:
- częstość fałszywych alarmów (false positive rate - FPR): prawdopodonieństwo klasyfikacji pozytywnej pod warunkiem, że przypadek jest negatywny <br>
$FPR = \frac{FP}{N} = \frac{FP}{FP+TN}$
- częśtość fałszywych odkryć (false discovery rate - FDR): jak wiele spośród klasyfikacji pozytywnych jest fałszywych <br>
$FDR = \frac{FP}{FP+TP}$

3. Precyzja:
- precyzja pozytywna (positive predictive value - PPV): prawdopodobieństwo, że jeżeli wynik jest pozytywny, to stan faktyczny również <br>
$PPV = \frac{TP}{TP+FP}$
- precyzja negatywna (negative predictive value - NPV): prawdopodobieństwo, że jeżeli wynik jest negatywny, to stan faktyczny również <br>
$NPV = \frac{TN}{TN+FN}$

4. Miary zbalansowane:
- dokładność (accuracy - ACC): prawdopodobieństwo prawidłowej klasyfikacji <br>
$ACC = \frac{TP + FN}{P + N}$
- $F_1$ (średnia harmoniczna z precyzji i czułości) <br>
$F_1 = \frac{2 \cdot PPV \cdot TPR}{PPV + TPR}$

### Reprezentacja graficzna

Tablica pomyłek - powszechnie stosowany diagram w formie dwuwymiarowej tablicy, której prostopadłe osie reprezentują klasy rzeczywiste oraz klasy przewidywane. Pozwala określić prawdopodobieństwa realizacji TP, TN, FP, FN. 

### Literatura:
1. https://brain.fuw.edu.pl/edu/index.php/Uczenie_maszynowe_i_sztuczne_sieci_neuronowe/Wykład_Ocena_jakości_klasyfikacji
2. https://pl.wikipedia.org/wiki/Tablica_pomyłek