# YOLO (You Only Look Once) – Temelden İleriye


## 1️⃣ YOLO’nun Tanımı

**YOLO (You Only Look Once)**, gerçek zamanlı **nesne tespiti (object detection)** için geliştirilmiş bir algoritmadır.  

**Özellikleri:**  
- Tek CNN ağı ile **tek geçişte (single pass)** tüm nesneleri tahmin eder  
- Girdi → Görüntü, çıktı → Her nesnenin konumu (bounding box) + sınıfı  
- Hızlıdır (real-time detection için uygundur)  

> Kısaca: **YOLO = CNN tabanlı, tek adımda nesne tespiti.**


## 2️⃣ YOLO’nun Farkı

Eskiden nesne tespiti:  
1. Region Proposal Network → olası bölgeleri önerir  
2. Her bölgeyi ayrı CNN ile sınıflandırır  

YOLO farkı:  
- **Tüm görüntüyü tek seferde işliyor**  
- CNN → SxS ızgara → B bounding box + C sınıf tahmini  
- Hem **lokasyon** hem **sınıf** tek ağ tarafından öğreniliyor  



## 3️⃣ YOLO’nun Temel Mantığı

1. Görüntüyü **S x S** ızgaraya böl  
2. Her hücre için:  
   - **B bounding box** tahmini `[x, y, w, h, confidence]`  
   - **C sınıf olasılığı** tahmini  
3. Çıktı → `[S, S, B*5 + C]`  
4. Tahminler üzerinde **Non-Max Suppression (NMS)** uygula → çakışmaları temizle  

> Örnek: S=7, B=2, C=3 → her hücre 13 parametre tahmin ediyor  



## 4️⃣ Çıktı ve Hesaplama Mantığı

- **Bounding Box (B)**
  - `x, y` → kutu merkezi (hücre koordinatına göre normalize)  
  - `w, h` → kutu boyutu (görüntü boyutuna göre normalize)  
  - `confidence` → kutuda nesne var mı olasılığı  

- **Class Probabilities (C)**
  - Her sınıf için olasılık  
  - Confidence ile çarpılır → final score  

- **Loss Function**
  - **Localization loss** → x, y, w, h hatası (MSE)  
  - **Confidence loss** → nesne var mı yok mu  
  - **Class loss** → sınıf hatası (cross-entropy)  
  - Toplam loss = λ_coord * loc_loss + conf_loss + class_loss  



## 5️⃣ YOLO’nun Evrimi

| Versiyon | Özellik |
|----------|---------|
| YOLOv1   | Basit, hızlı ama küçük nesnelerde zayıf |
| YOLOv2   | Anchor boxes ile geliştirilmiş |
| YOLOv3   | Multi-scale tahmin, küçük/orta/büyük nesneler için |
| YOLOv4/5/8 | Optimize edilmiş, hızlı ve daha doğru |

> Günümüzde **YOLOv5 veya YOLOv8** kullanmak, eğitim ve canlı tespit için daha pratik.



## 6️⃣ YOLO’nun CNN Mimarisi Mantığı

- **Özellik çıkarıcı (Backbone)** → Convolution + Pooling → Görüntüden özellik haritası çıkarır  
- **Tahmin katmanı (Head)** → Conv 1x1 ile `[S, S, B*5+C]` çıktısı üretir  
- Anchor boxes ve residual bloklar YOLOv3+ versiyonlarda eklenir  



## 7️⃣ Canlı Sistem / Video Mantığı

Adım adım akış:



* Camera/Video → Frame Grab → Preprocess → YOLO Model → NMS → Crop/Analyze → Display/Save


- **Frame Grab** → OpenCV ile video veya kamera  
- **Preprocess** → Resize, normalize  
- **YOLO** → Tahmin `[S, S, B*5+C]`  
- **Post-process** → Confidence threshold + NMS  
- **Crop/Analyze** → İstenirse bounding box’ı OCR veya başka modelle kullan  
- **Display** → Frame üzerine kutu çizme  

> Bu akış, canlı plaka tespiti veya herhangi bir nesne tespiti için kullanılabilir.



## 8️⃣ Özet Mantık

1. YOLO **CNN tabanlıdır** → ayrı CNN gerekmez  
2. Görüntüyü SxS ızgaraya böl → her hücre B box + C class tahmin eder  
3. Tek geçiş → hızlı ve real-time  
4. Loss → localization + confidence + class  
5. Post-processing → NMS ile final kutular  
6. Canlı kullanım → frame grab + preprocess + model + postprocess → display  



---
# YOLO vs Klasik CNN


## 1️⃣ YOLO ve CNN Farkları

| Özellik                  | Klasik CNN                    | YOLO                               |
|---------------------------|-------------------------------|------------------------------------|
| Amaç                     | Sınıflandırma                 | Nesne tespiti (object detection)  |
| Girdi                     | Tek görüntü                   | Tek görüntü                        |
| Çıktı                     | Tek sınıf olasılığı           | Bounding box + sınıf olasılığı    |
| Konum bilgisi             | Yok                           | Var (x, y, w, h)                  |
| Çoklu nesne tespiti       | Zor / ayrı ağ gerekir         | Tek ağ ile tek geçişte mümkün      |
| Tahmin mantığı            | Dense katman → softmax        | SxS grid + B box + C class         |
| Performans                | Genellikle daha yavaş çoklu nesne için | Real-time (tek geçiş)          |

## 2️⃣ YOLO’nun Avantajları (CNN’e Göre)

| Avantaj                    | Açıklama                                                    |
|-----------------------------|------------------------------------------------------------|
| Hızlı (Real-time)           | Tek geçişte tüm nesneleri tahmin eder                     |
| Tek model ile end-to-end    | Bölge önerisi + sınıflandırma ayrı ayrı gerekmez         |
| Çoklu nesne tespiti         | Aynı anda birden fazla nesneyi bulabilir                 |
| Konum ve sınıf tahmini      | Hem bounding box hem sınıf olasılıklarını birlikte verir |
| Kolay optimizasyon          | Loss fonksiyonu localization + confidence + class birleşimi|
| Küçük ve büyük nesnelerde optimize edilebilir | Multi-scale veya anchor box ile geliştirilmiş sürümler |



--- 
# YOLO vs CNN – Veri Hazırlama Aşamaları



## 1️⃣ Klasik CNN (Classification) Veri Hazırlığı

- Amaç: Görüntüleri sınıflandırmak
- Her görüntü bir sınıfa ait (label)
- Tipik aşamalar:

1. **Veri Toplama:** Görüntüler tek sınıf veya birden fazla sınıftan oluşur
2. **Labelleme:** Her resme bir sınıf etiketi (`cat`, `dog`, `car` vb.)
3. **Ön İşlem (Preprocessing):**
   - Resize (örn: 224x224)
   - Normalize (0-1 veya mean/std)
   - Data augmentation (flip, rotate, color jitter)
4. **Batch Hazırlama:** DataLoader ile batch oluştur
5. **Model Girdisi:** `[batch, 3, H, W]`, çıkış → sınıf olasılığı

> CNN’de sadece sınıf etiketi gerekir, bounding box veya lokasyon bilgisi gerekmez.


## 2️⃣ YOLO (Object Detection) Veri Hazırlığı

- Amaç: Görüntüdeki **nesneleri tespit etmek**  
- Her görüntü birden fazla nesne içerebilir
- Tipik aşamalar:

1. **Veri Toplama:** Görüntüler nesneler içerir (örn: arabalar, plakalar)
2. **Labelleme:**  
   - Her nesne için bounding box `[x, y, w, h]`  
   - Sınıf etiketi `class`  
   - Label formatı genellikle: `[class, x_center, y_center, width, height]` (normalize edilmiş)
3. **Ön İşlem (Preprocessing):**
   - Resize (örn: 416x416)  
   - Normalize  
   - Data augmentation (flip, rotate, scale, color jitter, random crop)  
   - Bounding box koordinatları da transform edilir
4. **Anchor Box / Grid Hazırlığı (YOLOv2+):**
   - Modelin SxS grid mantığına uygun olarak label mapping yapılır
   - Her hücre hangi bounding box’a ait olduğunu bilir
5. **Batch Hazırlama:** `[batch, 3, H, W]` + `[batch, S, S, B*5 + C]` şeklinde
6. **Model Girdisi:** Hem görüntü hem label bounding box + class

> YOLO veri hazırlığı daha karmaşık: **lokasyon ve sınıf bilgisi birlikte**, grid ve anchor box mantığı ile eşleştirilir.



## 3️⃣ Özet Karşılaştırma

| Aşama                 | CNN (Classification)       | YOLO (Object Detection)                  |
|-----------------------|---------------------------|-----------------------------------------|
| Label                 | Sınıf etiketi             | Bounding box + class                     |
| Çoklu nesne           | Genellikle yok            | Var                                      |
| Grid / Anchor         | Yok                       | SxS grid, anchor box                     |
| Data augmentation     | Sadece resim bazlı        | Resim + bounding box koordinatları      |
| Girdi formatı         | [batch, 3, H, W]         | [batch, 3, H, W] + [batch, S, S, B*5+C]|



---

# YOLO – PyTorch ile Uygulama Adımları



## 1️⃣ Veri Hazırlığı ve Dataset

- Küçük bir veri seti (ör: arabalar + plakalar) hazırlanmalı
- Label formatı: `[class, x_center, y_center, w, h]` (normalize edilmiş)
- PyTorch **DataLoader** ile batch’ler oluşturulmalı
- **Data augmentation:** flip, rotate, color jitter, scale
- Görüntüler normalize edilmeli



## 2️⃣ Modelin Kurulması

- TinyYOLO veya basit YOLO modeli oluştur
  - **CNN backbone** → özellik çıkarımı
  - **Prediction head** → `[S, S, B*5 + C]` çıktısı
- Örnek:
```python
model = TinyYOLO(S=7, B=2, C=1)


## 3️⃣ Loss Fonksiyonu

- YOLO’nun özel **loss fonksiyonu** şunları içerir:
  - **Localization loss** → x, y, w, h hatası
  - **Confidence loss** → nesne var mı olasılığı
  - **Class loss** → sınıf tahmini
- PyTorch’ta **custom loss** olarak yazılır



## 4️⃣ Eğitim Döngüsü (Train Loop)

- Forward pass → tahmin `[S, S, B*5+C]`
- Loss hesapla → Backprop → Optimizer step
- Validation → performans ölçümü (mAP veya IoU)



## 5️⃣ Post-processing

- Çıktı → **confidence threshold** uygulanır
- **Non-Max Suppression (NMS)** → çakışan kutular temizlenir
- İstenirse **crop / display / save**



## 6️⃣ Canlı Sistem / Video

- OpenCV ile kamera veya video feed alınır
- Frame’ler preprocess → model → post-process
- Frame üzerine bounding box çizilir
- Gerçek zamanlı plaka tespiti veya nesne tespiti yapılır
