# 🧠 Alzheimer MRI Sınıflandırması: Keşifçi Veri Analizi (EDA)

Bu notebook, model eğitimine başlamadan önce veri setimizin yapısını, içeriğini ve karşılaşılabilecek potansiyel problemleri anlamak için hazırlanmıştır.

### 1. Veri Seti Genel Bakış

MRI görüntüleri, Alzheimer hastalığının farklı evrelerindeki beyin atrofisi (küçülmesi) gibi yapısal değişiklikleri gösterir. Modelimizin bu farkları öğrenebilmesi için, verinin doğru bir şekilde anlaşılması ve ön işlenmesi kritik öneme sahiptir. Görüntülerimizin standart boyutu **`176x208`** pikseldir. Bu boyut, derin öğrenme modellerine beslenmeden önce yeniden boyutlandırma gerektirir.

### 1. Veri Seti Genel Bakış

MRI görüntüleri, Alzheimer hastalığının farklı evrelerindeki beyin atrofisi (küçülmesi) gibi yapısal değişiklikleri gösterir. Modelimizin bu farkları öğrenebilmesi için, verinin doğru bir şekilde anlaşılması ve ön işlenmesi kritik öneme sahiptir. Görüntülerimizin standart boyutu **`176x208`** pikseldir. Bu boyut, derin öğrenme modellerine beslenmeden önce yeniden boyutlandırma gerektirir.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


class_counts = {
    'MildDemented': 716,
    'ModerateDemented': 51,
    'NonDemented': 2559,
    'VeryMildDemented': 1791
}

df = pd.DataFrame(list(class_counts.items()), columns=['Class', 'Count'])

plt.figure(figsize=(10, 6))
sns.barplot(x='Class', y='Count', data=df, palette='viridis')
plt.title('Sınıf Dağılımı', fontsize=16)
plt.xlabel('Alzheimer Evresi', fontsize=12)
plt.ylabel('Görüntü Sayısı', fontsize=12)
plt.xticks(rotation=45)
plt.show()

### 2. Sınıf Dağılımı Analizi

#### **Analiz:**
* **`NonDemented`** sınıfı **2559** görüntü ile veri setindeki en baskın sınıftır.
* **`ModerateDemented`** sınıfı ise sadece **51** görüntü ile en nadir sınıftır. Bu, modelin bu sınıfı doğru bir şekilde öğrenmesi için ciddi bir zorluk teşkil edecektir.
* Bu dengesizlik, modelin yüksek bir genel doğruluk (`accuracy`) elde etmek için çoğunluk sınıfları (`NonDemented`) tahmin etmeyi öğrenmesine ve azınlık sınıfları (`ModerateDemented`) göz ardı etmesine neden olabilir.

In [None]:
from PIL import Image
import os


image_paths = {
    'MildDemented': '../images/mildDem0.jpg',
    'ModerateDemented': '../images/moderateDem0.jpg',
    'NonDemented': '../images/nonDem0.jpg',
    'VeryMildDemented': '../images/verymildDem0.jpg'
}

plt.figure(figsize=(12, 10))
for i, (cls, path) in enumerate(image_paths.items()):
    ax = plt.subplot(2, 2, i + 1)
    img = Image.open(path)
    plt.imshow(img, cmap='gray')
    plt.title(f'Sınıf: {cls}')
    plt.axis('off')

plt.tight_layout()
plt.show()

### 3. Örnek Görüntü Görselleştirmesi

Her sınıftan bir örnek görüntüye bakmak, sınıflar arasındaki görsel farkları anlamamıza yardımcı olur. Özellikle `NonDemented` ile `VeryMildDemented` arasındaki ince farkları görmek zor olabilir.

### 4. Sonuç ve Çıkarımlar

Bu keşifçi analizden elde ettiğimiz ana bulgular şunlardır:
1.  **Sınıf Dengesizliği:** Veri setimiz, özellikle `ModerateDemented` sınıfı için ciddi bir dengesizlik göstermektedir. Bu, modelin eğitiminde dikkatle ele alınması gereken en büyük sorundur.
2.  **Ön İşleme İhtiyacı:** Görüntülerin farklı boyutlara sahip olması, modelin girdi katmanına beslenmeden önce yeniden boyutlandırma gibi standart ön işleme adımlarının zorunlu olduğunu göstermektedir.
3.  **Görsel Zorluk:** Sınıflar arasındaki farklar (özellikle `NonDemented` ve `VeryMildDemented` arasında) görsel olarak çok ince olduğu için, modelin bu farkları ayırt edebilmesi için güçlü bir mimari ve optimizasyon stratejileri gereklidir.

Bu bulgular, **`WeightedRandomSampler`**, **`Focal Loss`** ve **transfer öğrenme** gibi stratejilere neden ihtiyaç duyduğumuzu haklı çıkarmaktadır.