
# 1. Teorik Açıklamalar

## Sınıflandırma Metrikleri

**1. Doğruluk (Accuracy)**  
$$ Accuracy = \frac{TP + TN}{TP + TN + FP + FN} $$  
Doğru tahminlerin toplam tahminlere oranıdır. Veri seti dengeli olduğunda kullanışlıdır.

**2. Hassasiyet (Precision)**  
$$ Precision = \frac{TP}{TP + FP} $$  
Pozitif tahminlerin ne kadarının doğru olduğunu gösterir. Yanlış pozitiflerin önemli olduğu durumlarda tercih edilir.

**3. Duyarlılık (Recall - Sensitivity)**  
$$ Recall = \frac{TP}{TP + FN} $$  
Gerçek pozitiflerin ne kadarının doğru tahmin edildiğini gösterir. Yanlış negatiflerin önemli olduğu durumlarda kullanılır.

**4. F1 Skoru**  
$$ F1 = 2 * \frac{Precision * Recall}{Precision + Recall} $$  
Precision ve recall arasında denge kurar. Veri dengesizse daha anlamlıdır.

**5. ROC - AUC Skoru**  
ROC eğrisi, TPR ve FPR değişimlerini gösterir. AUC, eğri altındaki alandır. 1'e yakın olması iyidir.

**6. Hata Matrisi (Confusion Matrix)**  
Modelin doğru ve yanlış tahminlerini TP, TN, FP, FN olarak gösterir.

## Regresyon Metrikleri

**1. Ortalama Mutlak Hata (MAE)**  
$$ MAE = \frac{1}{n} \sum |y_i - \hat{y}_i| $$  
Tahmin hatalarının ortalama mutlak değeri. Dışa duyarlı değildir.

**2. Ortalama Kare Hata (MSE)**  
$$ MSE = \frac{1}{n} \sum (y_i - \hat{y}_i)^2 $$  
Hataların karesi alınır. Büyük hataları daha çok cezalandırır.

**3. Kök Ortalama Kare Hata (RMSE)**  
$$ RMSE = \sqrt{MSE} $$  
MSE'nin kareköküdür. Yorumlaması daha kolaydır.

**4. R-kare (R²)**  
Modelin açıklama gücünü gösterir. 1'e yakınsa model iyidir.



# 2. Örnek Senaryolar ve Yorumlama (Genişletilmiş)

---

### 📌 Kanser Teşhisi
%95 doğruluk yüksek gibi görünse de, hasta sınıfı sadece %5 ise, tüm hastaları "sağlıklı" olarak tahmin eden model de %95 doğruluk alır. Bu durumda **Recall** kritik önemdedir.

---

### 📌 Sınıflandırmada Precision vs Recall

- **Polis baskını algoritması**: Yanlış alarm zarar vermez → **Recall** önemli.
- **Sahte belge tespiti**: Masum kişilerin suçlanmaması önemli → **Precision** önemli.

---

### 📌 MAE vs RMSE

- MAE tüm hataları eşit cezalandırır.
- RMSE büyük hataları daha fazla cezalandırır.
- Örn: Ev fiyatı tahmininde RMSE daha anlamlı olabilir çünkü büyük farklar önemli.

---

### 📌 E-Ticarette Ürün Tavsiyesi

- **Precision** önemli: Kullanıcının ilgilenmeyeceği ürünleri göstermemek gerekir.
- **Recall**: Yeni ürünleri keşfetmesini sağlamak istiyorsak da önemli olabilir.
- Bu durumda **F1 skoru** tercih edilebilir.

---

### 📌 Sahtekârlık Tespiti

- **Recall**: Dolandırıcılığı kaçırmak çok tehlikeli.
- **Precision**: Yanlış alarm müşteri memnuniyetini bozar.
- **F1 skoru** ikisini dengelemek için kullanılır.

---

### 📌 Çocukluk Aşı Takibi

- Asıl önemli olan hiç aşılanmamış çocukları kaçırmamak → **Recall** çok önemli.

---

### 📌 Hava Tahmini (Regresyon)

- 3-5 derece fark tolere edilebilir → **MAE** yeterli olabilir.
- Ancak büyük farklar istenmiyorsa → **RMSE** tercih edilir.

---

### 📌 Enerji Tüketimi Tahmini

- Büyük hatalar ciddi ekonomik zararlara yol açar → **RMSE** kritik.
- Küçük farklar tolere edilebilir → **MAE** yeterlidir.

---

### 📌 Öğrenci Not Tahmini

- Ortalama hata önemliyse → **MAE** tercih edilir.
- Sınırda geçip kalma durumlarında büyük farklar önemlidir → **RMSE** anlamlıdır.



# 3. Karşılaştırmalı Analiz

### Sınıflandırma
**Spam E-posta Tespiti**:  
- Accuracy %95 olabilir ama F1 skoru düşükse, bu model dengeli değil.  
- Çünkü spam sınıfı azsa, tüm e-postaları "spam değil" olarak işaretleyip yüksek doğruluk sağlanabilir. F1 skoru bize dengenin durumunu gösterir.

### Regresyon
**Ev Fiyatı Tahmini**:  
- RMSE tercih edilir çünkü 500.000 TL'lik tahminde 50.000 TL sapma ciddi sonuç doğurur.
- MAE daha basit ancak büyük hataları bastırır.

**Finansal Tahminler**:  
- MAE riskli olabilir çünkü büyük hataları tolere eder.
- RMSE daha uygun çünkü büyük hataları cezalandırır.



In [None]:

from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay, roc_curve, auc
import matplotlib.pyplot as plt
import numpy as np

# Örnek sınıflandırma
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 0]
y_pred = [1, 0, 0, 1, 0, 1, 1, 0, 1, 0]

# Confusion Matrix
cm = confusion_matrix(y_true, y_pred)
disp = ConfusionMatrixDisplay(confusion_matrix=cm)
disp.plot()
plt.title("Hata Matrisi")
plt.show()

# ROC Curve
y_scores = [0.9, 0.2, 0.4, 0.8, 0.1, 0.7, 0.6, 0.3, 0.95, 0.05]
fpr, tpr, _ = roc_curve(y_true, y_scores)
roc_auc = auc(fpr, tpr)

plt.figure()
plt.plot(fpr, tpr, label=f'ROC curve (area = {roc_auc:.2f})')
plt.plot([0, 1], [0, 1], linestyle='--')
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Eğrisi')
plt.legend()
plt.show()



# Kaynakça

1. Géron, A. (2019). *Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow*. O'Reilly Media.
2. Towards Data Science: [Precision vs Recall](https://towardsdatascience.com/precision-vs-recall-386cf9f89488)
3. Scikit-learn Documentation: [https://scikit-learn.org/stable/modules/model_evaluation.html](https://scikit-learn.org/stable/modules/model_evaluation.html)
