# Model Performans Metrikleri

https://scikit-learn.org/stable/modules/classes.html#module-sklearn.metrics

Modelinizin ne kadar başarılı olduğunu ölçmek için kullandığınız performans metrikleri (kriterleri) hayati öneme sahiptir.

Doğru metrikle bakmazsanız, başarılı modeli başarısız, başarısız modeli de başaralı zannedebilirsiniz.

Machine Learning modelleri türlerine göre aşağıdaki metriklerle ölçülür:

* Classification
    * Accuracy
    * Precision
    * Recall
    * F1 Score
    * ROC-AUC Curve
    * Log-Loss (Logarithmic Loss)
     
    
* Regression
    * MSE (Mean Squared Error)
    * MAE (Mean Absolute Error)
    * R^2 ve Adjusted R^2

Not: Daha önceki derslerimizde Regresyon ile ilgili metrikleri görmüştük. 

Dolayısı ile burada sadece Sınıflandırma metriklerini göreceğiz.

## Classification

### Confusion Matrix

**Confcusion Matrix** sınıflandırma modelinin performansını ölçmek için kullanılan özel bir tablodur.

<img src='images/confusion_matrix.jpg' />

<img src='images/confusion_matrix_2.png' />

Confusion Matrix şöyle okunur:

**Sonuç** - **Ne Söylemişim**

* TP : True Positive  (ben positive demişim ve sonuç doğru)
* FP : False Positive (ben positive demişim ama sonuç yanlış)

### Accuracy

**Null Accuracy:** Hiçbir model yürütmeden direk olarak en fazla bulunan sınıfı seçmeye denir.

Bunu şunun için kullanırız, hiçbir model yürütmesek elde edeceğimiz en iyi accuracy en yüksek sınıflı olanı seçme oranıdır.

Ör: Toplam 100 adet veri olsun.

* 0 -> 60 adet
* 1 -> 40 adet

Böyle bir durumda **Null Accuracy** `%60 olasılıkla 0 classını seçmek` olacaktır.

**Önemli Not:** Eğer veri setiniz homojen (balanced) ise, yani sınıf başına toplam adetler birbirine yakınsa, o zaman Accuray iyi bir metrik olabilir.

Eğer sınıf dağılımları homojen değilse, Accuracy kullanmamaya çalışın.

**Accuracy:** Doğru tahminler toplam verinin ne kadarı?

<img src='images/accuracy.jpg' />

$$ Accuracy = \frac{TN + TP}{TN + FP + FN + TP} $$

### Precision

**Precision:** Toplam pozitif tahminler içinde Doğru olan Pozitiflerin oranı ne?

<img src='images/precision.jpg' />

$$ Precision = \frac{TP}{FP + TP} $$

### Recall

**Recall:** Sonuç gerçekten Pozitif iken, doğru tahmin etmiş olma oranı nedir?

<img src='images/recall.jpg' />

$$ Recall = \frac{TP}{FN + TP} $$

### F1 Score

**F1 Score:** 

Precision ve Recall'un ağırlıklı ortamalasıdır.

Dolayısı ile hem FP (False Positive) hem FN (False Negative) değerlerini göz önünde bulundurur.

F1 Score'u gözümüzde canladırmak zor olsa da Accuracy'den daha geçerli kabul edilir.

$$ F_1 = 2 * \frac{Precision * Recall}{Precision + Recall} $$

### ROC-AUC Curve

**ROC: Receiver Operating Characteristic Curve**: Olasılık Eğrisi

**AUC: Area Under the Curve**: Olasılık Eğrisi Altındaki Alan

`Area Under the Receiver Operating Characteristic Curve (ROC-AUC)`

**ROC-AUC** sınıflandırma problemleri için kullanılan önemli bir performans metriğidir. (Genel olarak Binary Classification için geçerlidir.)

Modelin sınıfları birbirinden ayırmada ne kadar başarılı olduğunu gösterir.

Yüksek AUC (Area Under Curve) değeri şu demektir:

Modeliniz 
* 0'ları 0 olarak
* 1'leri 1 olarak

sınıflandırmakta başarılıdır.

**TPR (True Positive Rate):** Pozitifler içinde True Pozitif olanların oranı

**FPR (False Positive Rate):** Negatifler içinde False Pozitif olanların oranı

<img src='images/roc_auc.png' />

<img src='images/roc_auc_2.jpg' />

ROC-AUC Skoru aslında modeliniz **hassaslığını** verir.

### Log-Loss (Logistic Loss)

**Log-Loss (Logistic Loss):** Bir diğer adıyla `Cross-Entropy Loss`.

Negative Log Likelihood yani Logaritmik Olasılıkların Negatif Toplamını verir.

$$ L_{\log}(y, p) = -(y \log (p) + (1 - y) \log (1 - p)) $$

Log-Loss'un Açıklaması:

* `y` classının olma olasılığı `p` olsun.
* `y`'nin olmaması `1-y`'nin olmasıdır
* `1-y`'nin olma olasılığı `1-p` dir.
* `y`nin olma olasılığı ile çarpımı + `1-y`nin olma olasılığı ile çarpımı
* bize iki sınıfın da olaslık çarpımlarının toplamını verir
* bu sonucun negatif değeri LogLoss değeridir

LogLoss aslında yanlış tahminleri cezalandırır.

LogLoss değerinin olabildiğince küçük yani, 0'a yakın olması istenir.

Dolayısı ile 0'a yakın bir LogLoss modelinizin sınıfları doğru tahmin ettiğini gösterir.

Diğer bir deyişle 0 LogLoss demek şu demek: 

* Gerçek y değeri Pozitif iken siz de Pozitif demişsiniz
* Gerçek y değeri Negatif iken siz de Negatif demişsiniz