
# Quadratic Weighted Kappa (QWK)

**Quadratic Weighted Kappa**, sınıflandırma problemlerinde değerlendiricilerin (örneğin modellerin veya insanlar arası) ne kadar iyi anlaştığını ölçmek için kullanılan bir istatistiksel metriktir. Genellikle **sıralı sınıflandırma problemleri** için uygundur. Yani sınıflar arasında doğal bir sıralama varsa (örneğin 0-1-2-3 gibi), QWK metrik olarak tercih edilir.

## Nerelerde Kullanılır?
- Sıralı sınıflandırma problemlerinde model başarımını ölçmek için (örneğin, tıbbi derecelendirme, sınav puanı tahmini)
- Kaggle yarışmalarında (örneğin: Facebook V: Predicting Exam Scores)

## Formülü

Quadratic Weighted Kappa formülü şu şekildedir:

$$
\kappa = 1 - \frac{\sum_{i,j} W_{i,j} O_{i,j}}{\sum_{i,j} W_{i,j} E_{i,j}}
$$

Burada:

- $O$ gözlemlenen anlaşma matrisidir (confusion matrix)
- $E$ beklenen anlaşma matrisidir (random expectation)
- $W$ ağırlık matrisidir

Ağırlık matrisi $W_{i,j}$ genellikle şu şekilde tanımlanır:

$$
W_{i,j} = \frac{(i - j)^2}{(N - 1)^2}
$$

Burada $i$ ve $j$ tahmin edilen ve gerçek sınıfları temsil eder, $N$ ise toplam sınıf sayısıdır.


### 🔢 QWK (Quadratic Weighted Kappa) Skor Aralığı

Quadratic Weighted Kappa (QWK) skoru aşağıdaki aralıkta değişir:

$-1 \leq \mathrm{QWK} \leq 1$

#### 📘 Anlamı:

| QWK Skoru        | Açıklama |
|------------------|----------|
| **1.0**          | Mükemmel uyum (tahminler ile gerçek etiketler tamamen aynı) |
| **0.0**          | Tahminler rastgele yapılmış gibi (anlamlı bir uyum yok) |
| **< 0 (negatif)**| Tahminler, gerçek etiketlerle sistematik olarak çelişiyor (beklenenden daha kötü tahminler) |

In [1]:

import numpy as np
from sklearn.metrics import cohen_kappa_score

# Gerçek (true) sınıflar - sıralı sınıflar
y_true = [0, 1, 2, 2, 3, 4, 4, 4, 3, 2, 1, 0]

# Modelin tahmin ettiği sınıflar
y_pred = [0, 2, 2, 2, 3, 4, 4, 3, 3, 2, 1, 0]

# Quadratic Weighted Kappa skoru
qwk_score = cohen_kappa_score(y_true, y_pred, weights='quadratic')

print("Quadratic Weighted Kappa Skoru:", qwk_score)


Quadratic Weighted Kappa Skoru: 0.9538461538461538


Yukarıdaki skora göre değerlendirme yapacak olursak:

Modelimizin tahminleri ile gerçek değerler arasında yüksek tutarlılık vardır. QWK skorunun 0.95 olması, modelin sıralı sınıfları ayırt etmekte çok başarılı olduğunu gösterir. Bu, pratikte güvenilir bir modelimiz olduğunu gösterir.


Yukarıdaki örnekte:

- `y_true` gerçek (doğru) sınıf etiketlerini gösterir.
- `y_pred` modelin tahmin ettiği sınıf etiketlerini temsil eder.
- `cohen_kappa_score(..., weights='quadratic')` fonksiyonu, sklearn kütüphanesini kullanarak QWK skorunu hesaplar.

**Not:** Eğer `weights='linear'` şeklinde ayarlanırsa bu Linear Weighted Kappa olur.
