1) Kullanıcı bize verisetini verecek.
2) Bunu okuyacağız.
3) Preprocessing yapacağız.
4) Model kuracağız.
5) Modeli train edeceğiz.
6) Modeli deploy edeceğiz.
7) API kullanacağız.
8) Docker ile uzak sunucuya göndereceğiz.

Python'daki `assert` ve `with` ifadeleri **ileri seviye Python** (advanced Python) programlama tekniklerinde sıkça kullanılır. Bunları detaylı açıklayıp ardından diğer **advanced level Python ifadeleri ve yapıları** listesini vereceğim.

---

### 🔹 `assert` — Doğrulama İfadesi (Assertion)

`assert` bir **doğrulama** yapar. Eğer koşul **False** ise, `AssertionError` hatası fırlatır. Genellikle **test yazarken** veya bir durumun garanti edilmesi gerektiğinde kullanılır.

```python
def divide(a, b):
    assert b != 0, "Sıfıra bölme hatası!"
    return a / b

divide(4, 2)  # OK
divide(4, 0)  # AssertionError: Sıfıra bölme hatası!
```

Test örneği:

```python
def test_toplama():
    assert 1 + 1 == 2
```

---

### 🔹 `with` — Context Manager (Bağlam Yöneticisi)

`with`, kaynakların güvenli şekilde açılıp kapatılmasını sağlar. Genellikle **dosya işlemleri**, **kilitler**, **veritabanı bağlantıları** gibi yerlerde kullanılır. `with` bloğu bittiğinde, otomatik olarak kaynak serbest bırakılır.

```python
with open('dosya.txt', 'r') as f:
    icerik = f.read()
# dosya otomatik olarak kapanır
```

Aynı örneğin `try-finally` versiyonu:

```python
f = open('dosya.txt', 'r')
try:
    icerik = f.read()
finally:
    f.close()
```

---

## ⚙️ Diğer Advanced Level Python Yapıları / İfadeleri

| Yapı/İfade                                  | Açıklama                                                                                                          |
| ------------------------------------------- | ----------------------------------------------------------------------------------------------------------------- |
| **`yield`**                                 | Generator (üreteç) fonksiyonları oluşturur; `return` gibi ama fonksiyonu duraklatıp kaldığı yerden devam ettirir. |
| **`@decorator`**                            | Fonksiyonların davranışını değiştirmeye yarayan fonksiyonlardır (özellikle Flask, FastAPI, testler vs. kullanır). |
| **`*args`, `**kwargs`**                     | Esnek sayıda parametre alma yöntemidir.                                                                           |
| **Lambda**                                  | İsimsiz fonksiyon: `lambda x: x * 2`                                                                              |
| **`async` / `await`**                       | Asenkron programlama, özellikle I/O işlemleri için.                                                               |
| **`try-except-else-finally`**               | Gelişmiş hata yönetimi.                                                                                           |

---

# Testler

## Pytest ne zaman bir fonksiyonu test olarak algılar?

Pytest’in **bulup çalıştıracağı** fonksiyonlar şu kurallara uymalı:

* **Dosya adı**: `test_` ile başlamalı → örnek: `test_basit.py`
* **Fonksiyon adı**: `test_` ile başlamalı → örnek: `test_basit()`
* Test dosyası **projenin içinde** ve `pytest` tarafından taranabilir konumda olmalı

Senin dosya adı ve fonksiyon adı doğru görünüyor:
`test_basit.py` ve içinde `test_basit()` var.

* Doğru yola geldikten sonra **pytest -v** çalıştırırsak pytest kütüphanesi bizim için test yapmış olur.

![image.png](image3.png)

Bu data_loader'ı tüm testlerde kullanacağım için her seferinde tekrar tanımlamak yerine bir kez tanımlayıp tüm testlerde kullanabiliyorum.

**Modül yapmak için o klasörün içinde __init__.py dosyası oluşturmalıyız.**

`__pycache__` klasörleri, Python dosyaları (`.py`) çalıştırıldığında Python yorumlayıcısı tarafından **otomatik** olarak oluşturulur. Her yerde oluşmasının nedeni şudur:

### Ne işe yarar?

Python, `.py` dosyalarını çalıştırırken onları önce **bytecode**’a (`.pyc`) çevirir.
Bu bytecode'lar `__pycache__` klasörlerinde saklanır ki:

* Sonraki çalıştırmalarda Python, dosyayı tekrar derlemek zorunda kalmasın
* Uygulama daha hızlı başlasın


`__init__.py` dosyası, Python’da bir klasörü modül haline getirmek için kullanılır. Senin örneğinde, `claims_ml/src/data_loader` klasöründe bu dosyayı oluşturman, Python’a “bu klasör bir paket” demek anlamına gelir. Bu sayede, bu klasör içindeki modüller dışarıdan import edilebilir hale gelir. Eğer bu dosya olmazsa, bazı Python sürümlerinde bu klasör modül olarak algılanmaz ve `import` sırasında hata alınabilir.

`__init__.py` içine yazdığın `from .data_loader import DataLoader` gibi satırlar sayesinde, bu modülün dışarıya hangi bileşenleri sunacağını tanımlamış oluyorsun. Bu, modülün dışarıdan daha okunabilir ve düzenli bir şekilde kullanılmasını sağlar. Örneğin `from claims_ml.src.data_loader import DataLoader` demek yerine, `from claims_ml import DataLoader` gibi daha sade yollarla erişim sağlanabilir (paket yapısına göre).

Test dosyasına gelince; burada `pytest` kullanarak `DataLoader` sınıfını test ediyorsun. `@pytest.fixture` kullanarak `data_loader` adında bir fixture tanımlamışsın. Bu, test fonksiyonlarında tekrar tekrar `DataLoader()` nesnesi oluşturmamak için kullanılır. Test fonksiyonlarında bu fixture'ı parametre olarak verdiğinde, pytest otomatik olarak onu çağırır ve testte kullanılmak üzere hazırlar. Bu yaklaşım, testlerin daha temiz, tekrar edilebilir ve modüler olmasını sağlar. Ayrıca `test_check_if_file_extension_supported` fonksiyonu, belirli bir dosya uzantısının desteklenip desteklenmediğini test ederek `DataLoader`'ın beklenen şekilde çalışıp çalışmadığını kontrol eder.

Özetle, `__init__.py` modüler yapı kurmak ve dışa açık bileşenleri tanımlamak için, test dosyasındaki fixture ise kod tekrarını önleyerek okunabilir ve sürdürülebilir testler yazmak için kullanılır.


### 1. Hiçbir şey koymazsan (`normal_ad`)

Bu durumda, tanımladığın isim **public** kabul edilir.
Yani modül dışından rahatça erişilebilir ve erişilmesi **beklenir**.

```python
class Ornek:
    def fonksiyon(self):
        pass  # public
```

---

### 2. Tek alt çizgi (`_ad`)

Bu bir **geleneksel uyarıdır**: "Bu bir içsel (internal) şeydir, dışarıdan kullanmayın" demektir.
Ama erişilebilir, engellenmez.

```python
class Ornek:
    def _yardimci_fonksiyon(self):
        pass  # public ama internal gibi davranılır
```

VSCode ve diğer araçlar bunu kullanırken genelde "bu fonksiyonu kullanma" diye gri renkte gösterir.

---

### 3. Çift alt çizgi (`__ad`)

Bu durumda Python **name mangling** uygular.
Yani bu isim aslında sınıf içinde `_SınıfAdı__ad` olarak saklanır.

Bu, özellikle **alt sınıflardan gizlemek** içindir.
Örneğin override edilmesin diye.

```python
class Ornek:
    def __gizli(self):
        pass

o = Ornek()
o.__gizli()         # Hata verir
o._Ornek__gizli()   # Ulaşılır ama saklanmış olur
```

Bu yüzden `__` kullanmak bir tür "güvenli saklama" yöntemidir.

---

### 4. Alt çizgi ile başlayan ve bitenler (`__init__`, `__str__`, `__name__`)

Bunlar **özel (magic / dunder) methodlar**dır.
Python tarafından otomatik olarak çağrılır.
Senin özel isimlendirmelerinde kullanılmamalıdır (çakışma riskine girersin).

---

Kodun bazı yerlerinde breakpoint seçip debug edebiliriz.

## Coverage Report 

**Coverage report**, yazdığın testlerin **kodunun ne kadarını çalıştırdığını** gösteren bir rapordur.

Amaç, testlerin ne kadar kapsayıcı olduğunu ölçmektir.
Örneğin bir fonksiyonun varsa ama hiç test edilmiyorsa coverage oranı düşük çıkar.

---

**Neden yapılır?**

* Hangi kodlar test edilmiş, hangileri eksik görürsün
* Eksik testleri tamamlayarak hata riskini azaltırsın
* Kod kalitesini ve güvenilirliğini artırır

`pytest-cov` gibi araçlarla kolayca oluşturulur.


# Özet

## 🧪 1. Test Frameworkü: `pytest` ve `pytest-cov`

Sen bir Python projesi için **test altyapısını** kurdun. Kullanılan araçlar:

* [`pytest`](https://docs.pytest.org/) → Testleri çalıştırmak için
* [`pytest-cov`](https://pytest-cov.readthedocs.io/) → Kodun ne kadarının test edildiğini görmek için

---

## 📦 2. Proje Yapısı

Senin proje yapın kabaca şöyle:

```
Preprocessing-Skills/
│
├── claims_ml/                  # Asıl modül
│   └── src/
│       └── data_loader/
│           ├── data_loader.py
│           └── error_messages.py
│
├── tests/                      # Test dosyaları
│   └── data_loader/
│       └── test_data_loader.py
│
├── .venv/                      # Sanal ortam
├── htmlcov/                    # Coverage sonucu (html)
├── pyproject.toml              # Proje yapılandırması
```

---

## ⚙️ 3. `pyproject.toml` Ayarları

Test ortamını ve coverage ayarlarını burada tanımladın:

```toml
[project]
dependencies = [
    "pytest-cov>=6.2.1",
    ...
]

[dependency-groups]
dev = [
    "pytest>=8.4.1",
    "ruff>=0.12.7",
]

[tool.pytest.ini_options]
testpaths = [
    "tests",
]
```

---

## 🧪 4. Test yazımı

Örneğin `test_data_loader.py` içeriği şöyleydi:

```python
import pytest
import pandas as pd
from claims_ml.src.data_loader import DataLoader

@pytest.fixture
def data_loader():
    return DataLoader()

def test_check_if_file_extension_supported(data_loader):
    assert data_loader._check_if_file_extension_supported("file.csv") == ".csv"
```

* `@pytest.fixture` ile tekrar tekrar kullanılan `data_loader()` nesnesi tanımlandı
* `test_` ile başlayan fonksiyonlar otomatik olarak pytest tarafından çalıştırıldı

---

## 📈 5. Coverage testi

Coverage sonucu görmek için terminalde şu komutu çalıştırdın:

```bash
pytest --cov=claims_ml --cov-report=term-missing
```

Bu komut:

* `claims_ml` modülünün ne kadarının test edildiğini ölçtü
* Eksik kalan satırları terminalde gösterdi

---

## 🌐 6. HTML Coverage Raporu

Şu komutla görsel rapor da oluşturdun:

```bash
pytest --cov=claims_ml --cov-report=html
```

Sonrasında bu dosyayı açtın:

```
htmlcov/index.html
```

Tarayıcıda dosya bazlı, renkli coverage raporunu görüntüledin.

---

## ⚠️ 7. Sorunlar ve Çözüm

**Sorun:**
VSCode terminali `Anaconda`'ya bağlı kaldı → `pytest --cov` çalışmadı
**Çözüm:**

* `.venv\Scripts\Activate.ps1` ile sanal ortamı düzgün aktive ettin
* `pip install pytest pytest-cov` komutlarıyla doğru ortama kurulum yaptın
* `python -m pytest` komutuyla Anaconda dışı çalıştırmayı garantiledin

---

## ✅ Artık Elinde Ne Var?

* Tüm testlerin başarıyla çalıştığı bir `pytest` altyapısı
* %93 coverage oranına sahip bir modül
* Otomatik test + coverage raporu oluşturulabilen bir proje