# Scaling (Özellik Ölçekleme) Nedir? Nasıl Yapılır?

Özellik ölçekleme, makine öğrenmesi modellerinin farklı ölçeklerdeki değişkenlerle dengeli çalışabilmesi için veri sütunlarının belirli bir aralığa veya dağılıma dönüştürülmesidir. Ölçekleme yapılmadığında, değerleri büyük olan özellikler model tarafından “daha önemli” kabul edilerek sonuçları çarpıtabilir.

---

## 1. Özellik Ölçeklemenin Amacı

- **Adil Ağırlık Dağılımı**  
  Farklı birim veya büyüklükteki özellikler, mesafe ve ağırlık temelli algoritmalarda (K-Means, KNN, SVM vb.) haksız avantaj sağlar.

- **Optimizasyon Hızı ve Kararlılığı**  
  Gradient Descent gibi yöntemler, farklı ölçeklerdeki girdilerle çalışırken yakınsama sürecini yavaşlatabilir veya kararsızlaştırabilir.

- **Düzenleme (Regularization)**  
  L1/L2 cezalı modellerde (Ridge, Lasso), büyük ölçekli özellikler daha yüksek ceza alır; bu dengesiz ceza dağılımını önlemek için ölçekleme gerekir.

---

## 2. Yaygın Ölçekleme Yöntemleri

| Yöntem             | Açıklama                                                    | Kullanım Örneği                                |
|--------------------|-------------------------------------------------------------|------------------------------------------------|
| **StandardScaler** | Özelliği, ortalaması 0, standart sapması 1 olacak şekilde dönüştürür. | Normal dağılıma yakın veriler.                 |
| **MinMaxScaler**   | Değerleri [0, 1] (veya belirlenen başka aralık) içine sıkar.         | Görüntü piksel değerleri, sinir ağları girişi. |
| **RobustScaler**   | Medyanı 0, IQR (çeyrekler açıklığı) 1 olacak şekilde ölçekler; uç değer etkisini azaltır. | Aykırı değerlerin yoğun olduğu veri setleri.   |
| **MaxAbsScaler**   | Mutlak değerin maksimumunu 1’e ölçekler; sıfır merkezli kalır.        | Seyrek (sparse) matrisler, pozitif-negatif karışık veriler. |
| **Normalizer**     | Her örneği kendi L2 normuna böler; vektör uzunluğu = 1 olur.         | Metin madenciliği (TF-IDF), benzerlik ölçümleri. |

---

## 3. Nasıl Yapılır?

Özellik ölçekleme süreci dört temel adımdan oluşur. Her adımı dikkatle uygulayarak veri sızıntısını önleyebilir ve modelinizin genellenebilirliğini artırabilirsiniz.

### 3.1. Veriyi Eğitim ve Test Olarak Ayırın  
- **Neden?** Ölçekleyicinin parametrelerini yalnızca eğitim verisinden öğrenmek (data leakage’ı önlemek) için.  
- **Kod:**
  ```python
  from sklearn.model_selection import train_test_split

  X_train, X_test, y_train, y_test = train_test_split(
      X, y,
      test_size=0.2,
      random_state=42,
      shuffle=True
  )
