## 📘 Feature Scaling (Özellik Ölçekleme)

### 🔍 Neden Özellik Ölçekleme Gerekli?
Makine öğrenmesi algoritmalarının çoğu, değişkenlerin ölçeklerinden etkilenir. Özellikle **mesafeye dayalı** (k-NN, SVM, K-Means gibi) ve **gradiente dayalı** algoritmalar (Lojistik Regresyon, Yapay Sinir Ağları) için ölçekleme çok önemlidir.

Örneğin:
- Bir değişkenin değerleri 0-1 arasında, diğerinin 0-1000 arasında olması modelin dengesini bozabilir.
- Büyük ölçekli değişkenler küçük ölçeklileri baskılar.


### ⚙️ Yaygın Ölçekleme Yöntemleri

#### 1. **Min-Max Scaling (Normalization)**
- Verileri belirli bir aralığa (genelde 0 ile 1) sıkıştırır.

> ⚠️ Aykırı değerlere karşı duyarlıdır.


In [3]:
from sklearn.preprocessing import MinMaxScaler
import pandas as pd

data = pd.DataFrame({
    "age": [18, 22, 30, 45, 60],
    "salary": [1000, 1500, 2000, 3000, 5000]
})

scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(data)
pd.DataFrame(scaled_data, columns=data.columns)

Unnamed: 0,age,salary
0,0.0,0.0
1,0.095238,0.125
2,0.285714,0.25
3,0.642857,0.5
4,1.0,1.0


#### 2. **Standardization (Z-Score Normalization)**
- Ortalaması 0, standart sapması 1 olan dağılıma dönüştürür.
- 
> ✅ Aykırı değerlere daha dayanıklıdır.


In [5]:
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
scaled_data = scaler.fit_transform(data)
pd.DataFrame(scaled_data, columns=data.columns)

Unnamed: 0,age,salary
0,-1.093706,-1.06066
1,-0.836363,-0.707107
2,-0.321678,-0.353553
3,0.643356,0.353553
4,1.608391,1.767767


#### 3. **Robust Scaler**
- Ortanca (median) ve IQR (çeyrekler arası açıklık) kullanır.
- Aykırı değerlere karşı dayanıklıdır.


In [7]:
from sklearn.preprocessing import RobustScaler

scaler = RobustScaler()
scaled_data = scaler.fit_transform(data)
pd.DataFrame(scaled_data, columns=data.columns)

Unnamed: 0,age,salary
0,-0.521739,-0.666667
1,-0.347826,-0.333333
2,0.0,0.0
3,0.652174,0.666667
4,1.304348,2.0


## ✅ Özet
- Özellik ölçekleme, makine öğrenmesi modellerinde daha hızlı ve dengeli öğrenme sağlar.
- En yaygın yöntemler: **Min-Max**, **StandardScaler**, **RobustScaler**
- Hangi yöntemin kullanılacağı, veri yapısına ve algoritmaya bağlıdır.
