## Konular
- 1:  Supervised vs Unsupervised Learning
- 2:  Regresyon ve Sınıflandırma
- 3:  Overfitting & Underfitting
- 4:  Train/Test Split & Cross Validation
- 5:  Scikit-learn ile Model Kurma

# 1) Supervised vs Unsupervised Learning

### Supervised Learning (Denetimli Öğrenme)
Model, girdi verileriyle birlikte doğru çıktıları da öğrenir. Her veri örneği bir etiketle eşleştirilmiştir.

**Örnekler:**
- Ev fiyatı tahmini
- E-posta spam sınıflandırması
- Hastalık teşhisi

### Unsupervised Learning (Denetimsiz Öğrenme)
Model, sadece girdilerle çalışır ve veri içindeki yapıyı keşfetmeye çalışır. Etiket yoktur.

**Örnekler:**
- Müşteri segmentasyonu
- Kümelendirme (clustering)
- Boyut indirgeme (dimensionality reduction)

---

## Karşılaştırma Tablosu

| Özellik               | Supervised Learning             | Unsupervised Learning           |
|-----------------------|----------------------------------|----------------------------------|
| Veri Yapısı           | Girdi + Etiket (çıktı)          | Sadece girdi                    |
| Amaç                  | Tahmin yapmak                   | Yapı keşfetmek                  |
| Algoritmalar          | Regresyon, Sınıflandırma        | Kümelendirme, Boyut indirgeme   |
| Örnek                 | Hastalık teşhisi, fiyat tahmini | Müşteri segmentasyonu           |

---

## Test: Doğru mu Yanlış mı?

Aşağıdaki ifadeleri değerlendir:

1. ✅ Supervised learning’de model, veriyle birlikte doğru cevapları da öğrenir.  
2. ❌ Unsupervised learning’de hem girdi hem çıktı vardır.  
3. ✅ K-means algoritması unsupervised learning’e örnektir.  
4. ❌ Regresyon, unsupervised learning algoritmasıdır.

---

## Sonuç

Bu konu, makine öğrenmesinin temel ayrımını anlamak için kritik bir adımdır.  
Supervised öğrenme → tahmin odaklıdır.  
Unsupervised öğrenme → keşif odaklıdır.


---
---

# 2) Regresyon ve Sınıflandırma

### Regresyon
Sürekli (sayısal) bir değeri tahmin etmeye yönelik algoritmalardır.  
Model, girdi verilerine karşılık bir sayı üretir.

**Örnekler:**
- Ev fiyatı tahmini  
- Hava sıcaklığı tahmini  
- Bir ürünün satış miktarını öngörme

### Sınıflandırma
Veriyi kategorilere ayırmaya yönelik algoritmalardır.  
Model, girdi verilerine karşılık bir sınıf (etiket) tahmin eder.

**Örnekler:**
- E-posta spam mi değil mi  
- Hastalık var mı yok mu  
- Müşteri sadık mı değil mi

---

## Karşılaştırma Tablosu

| Özellik               | Regresyon                        | Sınıflandırma                   |
|-----------------------|----------------------------------|----------------------------------|
| Tahmin Tipi           | Sayısal (float, int)             | Kategorik (etiket)              |
| Örnek Çıktı           | 245.6 TL                         | "Spam" veya "Not Spam"          |
| Algoritmalar          | Linear, Polynomial Regression    | Logistic Regression, Decision Tree |
| Değerlendirme         | MSE, RMSE, R²                    | Accuracy, Precision, Recall     |

---

## Test: Doğru mu Yanlış mı?

1. ✅ Regresyon, sürekli bir değeri tahmin etmeye çalışır.  
2. ❌ Sınıflandırma algoritmaları sayısal tahmin yapar.  
3. ✅ Logistic Regression, sınıflandırma algoritmasıdır.  
4. ❌ R² skoru sınıflandırma modelleri için kullanılır.

---

## Sonuç

Regresyon ve sınıflandırma, supervised learning’in iki temel dalıdır.  
Veri tipine göre doğru algoritmayı seçmek, model başarısını doğrudan etkiler.



---
---

# 3️) Overfitting & Underfitting


### Overfitting (Aşırı Öğrenme)
Model, eğitim verisini **çok iyi öğrenir**, hatta **gürültü ve rastlantısal örüntüleri bile ezberler**.  
Bu yüzden yeni (görmediği) verilerde başarısı düşer.

**Belirtiler:**
- Eğitim verisinde yüksek doğruluk
- Test verisinde düşük doğruluk
- Karmaşık model yapısı

**Örnek:**
- Bir sınıflandırma modeli, eğitim verisindeki her örneği mükemmel ayırır ama yeni verilerde başarısız olur.

---

### Underfitting (Yetersiz Öğrenme)
Model, eğitim verisindeki temel örüntüleri bile öğrenemez.  
Hem eğitim hem test verisinde düşük başarı gösterir.

**Belirtiler:**
- Eğitim verisinde düşük doğruluk
- Test verisinde düşük doğruluk
- Çok basit model yapısı

**Örnek:**
- Lineer regresyon, karmaşık bir ilişkiyi düz çizgiyle açıklamaya çalışır.

---

## Karşılaştırma Tablosu

| Özellik               | Overfitting                      | Underfitting                    |
|-----------------------|----------------------------------|----------------------------------|
| Eğitim Başarısı       | Yüksek                           | Düşük                            |
| Test Başarısı         | Düşük                            | Düşük                            |
| Model Karmaşıklığı    | Fazla                            | Az                               |
| Genel Sebep           | Ezberleme                        | Yetersiz öğrenme                 |

---

## Test: Doğru mu Yanlış mı?

1. ✅ Overfitting, modelin eğitim verisini ezberlemesidir.  
2. ❌ Underfitting, test verisinde yüksek başarı sağlar.  
3. ✅ Basit modeller underfitting’e daha yatkındır.  
4. ❌ Overfitting, genellikle veri azlığıyla oluşur.

---

## Sonuç

Overfitting ve underfitting, model başarısını doğrudan etkileyen iki kritik durumdur.  
Amaç: **Genelleme başarısı yüksek** bir model kurmak.  
Bunu sağlamak için doğru model karmaşıklığı, veri miktarı ve düzenleme teknikleri gerekir.


---
---

# 4️) Train/Test Split & Cross Validation


### Train/Test Split
Veri setini ikiye ayırarak modelin **öğrenme** ve **genelleme** başarısını test etmeye yarar.

- **Train set**: Modelin öğrenmesi için kullanılır.
- **Test set**: Modelin daha önce görmediği verilerle sınanması için kullanılır.

**Amaç:** Modelin ezberleyip ezberlemediğini (overfitting) anlamak.

---

### Cross Validation (Çapraz Doğrulama)
Veri setini birden fazla parçaya ayırarak modelin farklı veri kombinasyonlarında test edilmesini sağlar.

- En yaygın yöntem: **K-Fold Cross Validation**
- Veri seti K parçaya bölünür, her seferinde bir parça test, kalanlar eğitim olarak kullanılır.
- Sonuçlar ortalanarak genel başarı elde edilir.

**Avantajları:**
- Daha güvenilir doğruluk ölçümü
- Veri seti küçükse daha verimli kullanım

---

## Karşılaştırma Tablosu

| Özellik               | Train/Test Split                 | Cross Validation                |
|-----------------------|----------------------------------|----------------------------------|
| Veri Bölme            | Genellikle 70/30 veya 80/20      | K parçaya bölünür (örneğin 5-fold) |
| Test Tekrarı          | Tek sefer                        | K kez test edilir               |
| Güvenilirlik          | Orta                             | Yüksek                          |
| Veri Kullanımı        | Sabit test seti                  | Tüm veri test edilir (dönüşümlü) |

---

## Test: Doğru mu Yanlış mı?

1. ✅ Train/test split, modelin genelleme başarısını ölçmek için kullanılır.  
2. ❌ Cross validation, sadece eğitim verisiyle çalışır.  
3. ✅ K-fold cross validation, her veri parçasını bir kez test seti olarak kullanır.  
4. ❌ Train/test split, küçük veri setlerinde daha güvenilirdir.

---

## Sonuç

Modelin başarısını ölçmek için sadece eğitim verisi yeterli değildir.  
Train/test split ve cross validation, modelin **gerçek dünyadaki performansını** tahmin etmek için kullanılır.  
Özellikle küçük veri setlerinde cross validation tercih edilir.


---
---

# 5️) Scikit-learn ile Model Kurma (Temel Yapı)


Scikit-learn, Python'da en yaygın kullanılan makine öğrenmesi kütüphanesidir.  
Model kurma süreci genellikle 4 adımdan oluşur:

1. **Veri Hazırlama**  
   - Girdi (X) ve çıktı (y) ayrılır.  
   - Gerekirse veri ölçeklenir, eksikler temizlenir.

2. **Model Seçimi**  
   - Regresyon mu, sınıflandırma mı?  
   - Örnek: `LinearRegression()`, `LogisticRegression()`, `DecisionTreeClassifier()`

3. **Model Eğitimi**  
   - `model.fit(X_train, y_train)` ile model veriye öğretilir.

4. **Tahmin ve Değerlendirme**  
   - `model.predict(X_test)` ile tahmin yapılır.  
   - Doğruluk, hata oranı gibi metriklerle değerlendirilir.

---

## En Basit Kod Örneği: Linear Regression

```python
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
import numpy as np

# Veri
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([2, 4, 6, 8, 10])  # y = 2x

# Veri bölme
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Model seçimi
model = LinearRegression()

# Model eğitimi
model.fit(X_train, y_train)

# Tahmin
y_pred = model.predict(X_test)

# Sonuç
print("Tahminler:", y_pred)


## Açıklamalar:
- `train_test_split`: Veriyi eğitim ve test olarak böler.
- `LinearRegression()`: En basit regresyon modeli.
- `fit()`: Modeli eğitir.
- `predict()`: Yeni veriler için tahmin üretir.


## Test: Doğru mu Yanlış mı?
1. ✅ `Scikit-learn`, Python’da yaygın ML kütüphanesidir.
2. ❌ `fit()` fonksiyonu tahmin yapmak için kullanılır.
3. ✅ `predict()` fonksiyonu test verisi üzerinde tahmin üretir.
4. ❌ `train_test_split` sadece sınıflandırma problemlerinde kullanılır.

---


## Sonuç

Bu yapı, tüm ML modellerinin temelidir. İster regresyon ister sınıflandırma olsun, bu 4 adım hep geçerlidir: Veri → Model → Eğitim → Tahmin & Değerlendirme


