---

# Autoencoder nedir?

* **Amacı:** Girdiyi **sıkıştırıp (encode)** tekrar **geri kurmak (decode)**.
* **Neden?** Önemli bilgiyi yakalayan **temsil (feature)** öğrenmek; gürültüyü atmak, boyutu azaltmak, anomaliyi yakalamak.

# Mimari (3 parça)

1. **Encoder:** $x \rightarrow z$

   * Katmanlar: Dense/CNN/RNN; aktivasyon: ReLU/tanh vs.
   * **Bottleneck (z):** Düşük boyutlu gizli temsil (latent).
2. **Decoder:** $z \rightarrow \hat{x}$

   * Encoder’ın ayna görüntüsü gibi.
3. **Kayıp (reconstruction loss):** $L(x,\hat{x})$

   * Sayısal veriler: **MSE**
   * İkili/0-1 görüntüler: **BCE**
   * Görüntü kalitesi: gerekirse **SSIM** ekleri

# Nasıl eğitilir? (adım adım)

1. Veriyi ölçekle/normalize et.
2. **Forward:** $x \to z \to \hat{x}$.
3. **Loss:** $L(x,\hat{x})$.
4. **Backprop + optimizer (Adam)**: Ağırlıkları güncelle.
5. Epoch’lar boyunca tekrarla → $\hat{x}$ giderek **x**’e yaklaşır; **z** faydalı temsil olur.

---

# Autoencoder türleri (temel–ileri)

## 1) Undercomplete AE (klasik)

* **$\dim(z) < \dim(x)$**: Zorunlu sıkıştırma → **bilgi özünü** yakalar.
* Aşırı ezberlemeye (overfitting) daha dirençli.

## 2) Overcomplete AE (özellik çıkarımı)

* **$\dim(z) \ge \dim(x)$**: Kapasite fazla → *tek başına* ezberleyebilir.
* **Şart:** Düzenleme ekle (aşağıdakiler) → güçlü **feature extractor** olur.

### Düzenleme/İndüktif Bias (ezberi önleyen fikirler)

* **Sparse AE:** Latent’te **seyreklik** (L1, KL penalty). Yalnızca birkaç nöron aktif → ayrıştırıcı özellikler.
* **Denoising AE:** Girdi **bozulur** (mask/gaussian tuz-biber), model temiz **x**’i kurmayı öğrenir → **genelleme** çok artar.
* **Contractive AE:** Encoder’ın türevine (Jacobian) **penalti**; küçük giriş değişimleri latent’te küçük değişim yapsın → **sağlamlık**.

> “Autoencoder Bias” dendiğinde burada kastedilen “**indüktif bias**”: undercomplete/sparse/denoising/contractive gibi **kısıtlar** ile modelin **doğru şeyi öğrenmeye yönlendirilmesi**.

## 3) Stacked AE vs Deep AE

* **Stacked AE:** Katmanları **tek tek** (greedy) ön-eğit → sonra uçtan uca ince ayar. Eski ama öğretici yaklaşım.
* **Deep AE:** Baştan sona **tek seferde** eğitilen çok katmanlı encoder–decoder (güncel pratikte daha yaygın).

> (Not: VAE bu bölümün dışında olabilir; AE’nin olasılıksal kuzeni. Şimdilik AE’yi oturtmak yeterli.)

---

# Nerede kullanılır?

* **Boyut indirgeme & görselleştirme:** PCA’nın doğrusal sınırlarının ötesinde **nonlinear** indirgeme.
* **Gürültü giderme / eksik tamamlama:** Denoising AE ile.
* **Anomali tespiti:** Normal veriye AE eğit; **reconstruction error** yüksek olanlar **anomali**.
* **Özellik çıkarımı:** $z$ vektörlerini başka modellerde (SVM, XGBoost, MLP) kullan.

---

# Pratik ipuçları

* **Veri ölçekleme** şart (özellikle MSE kullanıyorsan).
* **Bottleneck boyutu**: Çok küçük → bilgi kaybı; çok büyük → ezber. Val seti ile seç.
* **Regularization:** Dropout / Weight decay, DAE/SAE/CAE gibi denetimli kısıtlar.
* **Simetri şart değil:** Encoder güçlü, decoder sade olabilir (özellikle inference’ta sadece $z$ lazım ise).
* **Görüntüler:** CNN tabanlı AE (Conv → ConvTranspose/UpSampling) tercih et.
* **Değerlendirme:** Reconstruction loss + downstream görevde $z$ ile performans.

---

# Zihinsel model (tek cümleyle)

> **AE = sıkıştır–öğren–geri kur**. Bottleneck’teki **z**, verinin “özünü” tutar. Ezberi önlemek için **denoising/sparse/contractive** kısıtlar ekle; derin/stacked sürümlerle kapasiteyi arttır.
