### Hücre 1: Gerekli Kütüphanelerin Kurulumu (ViT için)

* **Amaç:**
    Vision Transformer (ViT) modeli ile görüntü sınıflandırma görevi için gerekli olan Python kütüphanelerinin Google Colab ortamına kurulması ve/veya güncellenmesi. Bu adım, projenin sonraki aşamalarında ihtiyaç duyulacak araçların (Hugging Face Transformers, Datasets, PyTorch, Torchvision vb.) doğru ve uyumlu versiyonlarının hazır olmasını sağlar.

* **Yapılan İşlemler:**
    1.  **Temel Transformatör Kütüphaneleri:**
        * `datasets`: Görüntü veri setlerini (örn: CIFAR-10) yüklemek ve işlemek için. Önceki projelerde stabil çalıştığını gördüğümüz `3.6.0` versiyonu hedeflenir.
        * `transformers`: ViT modelini, görüntü işlemcisini (`image processor` / `feature extractor`) ve `Trainer` API'sini kullanmak için. Önceki projelerde stabil çalıştığını gördüğümüz `4.48.3` versiyonu hedeflenir.
    2.  **Görüntü İşleme Kütüphaneleri:**
        * `torchvision`: PyTorch tabanlı görüntü yükleme, ön işleme (transformasyonlar, augmentasyon) ve standart görüntü veri setlerine erişim için temel bir kütüphanedir. Genellikle PyTorch versiyonuyla uyumlu bir versiyonu kurulur veya Colab'da zaten mevcuttur.
    3.  **Diğer Yardımcı Kütüphaneler:**
        * `scikit-learn`: Performans metriklerini hesaplamak için.
        * `matplotlib`, `seaborn`: Görselleştirmeler için.
    4.  **Kurulum Stratejisi:**
        * Önceki başarılı deneyimlerimize dayanarak, Colab'ın varsayılan temel kütüphanelerine (NumPy, Pandas vb.) doğrudan müdahale etmekten kaçınılır.
        * `datasets` ve `transformers` için bilinen stabil versiyonlar (`3.6.0` ve `4.48.3`) hedeflenir.
        * `torchvision`, genellikle Colab'da PyTorch ile birlikte geldiği ve uyumlu olduğu için ayrıca versiyon belirtilmeden kurulabilir/güncellenebilir (eğer gerekirse). Diğer kütüphaneler (`scikit-learn`, `matplotlib`, `seaborn`) için `pip`'in uyumlu güncel versiyonları seçmesine izin verilir.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * Bu hücre çalıştırıldığında, belirtilen kütüphaneler Colab ortamına kurulur/güncellenir.
    * Kurulum sırasında `pip`'in bağımlılık çözümleyicisi uyarılar verebilir; bunlar not edilecektir.
    * Hücre sonunda, kurulumların tamamlandığına dair bir mesaj ve **Colab çalışma zamanını "Restart runtime" ile yeniden başlatma** uyarısı verilecektir. Bu, yeni kurulan kütüphanelerin ortam tarafından doğru şekilde tanınması için zorunludur.
    * Yeniden başlatma sonrası, bu Hücre 1 **tekrar çalıştırılmamalıdır.**

In [None]:
# Hücre 1: Gerekli Kütüphanelerin Kurulumu (ViT için)

# Lütfen bu hücreyi çalıştırmadan önce, eğer yeni bir not defteri değilse,
# Colab çalışma zamanını "Disconnect and delete runtime" ile sıfırlamanız önerilir.
# Eğer yeni bir not defteri ise doğrudan çalıştırabilirsiniz.

print("ViT (Vision Transformer) projesi için gerekli kütüphaneler kuruluyor...")

# 1. Başarılı önceki projelerdeki stabil versiyonları hedefleyelim:
#    NumPy ve Pandas'a dokunmuyoruz, Colab'ın varsayılanını kullanacağız.

# Datasets ve Transformers için bilinen iyi versiyonlar:
!pip install datasets==3.6.0 -q
print("Datasets 3.6.0 kuruldu.")

!pip install transformers==4.48.3 -q
print("Transformers 4.48.3 kuruldu.")

# 2. Görüntü işleme kütüphaneleri:
# torchvision genellikle PyTorch ile uyumlu gelir ve Colab'da genellikle güncel bir versiyonu bulunur.
# İhtiyaç halinde güncelleyebiliriz veya spesifik bir versiyon kurabiliriz. Şimdilik sadece kuralım.
!pip install torchvision -q
print("torchvision kuruldu/güncellendi.")

# 3. Diğer yardımcı kütüphaneler
!pip install scikit-learn matplotlib seaborn Pillow -q
# Pillow (PIL Fork) görüntü işleme için torchvision ve diğerleri tarafından kullanılır, güncel olmasında fayda var.
print("Scikit-learn, Matplotlib, Seaborn ve Pillow kuruldu/güncellendi.")

print("\nKütüphane kurulumları (Hücre 1) tamamlandı.")
print("!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!")
print("!!! LÜTFEN ŞİMDİ Colab Çalışma Zamanını (Runtime -> Restart runtime)      !!!")
print("!!! KESİNLİKLE YENİDEN BAŞLATIN. Bu, kurulumların oturmasını sağlar.         !!!")
print("!!! Yeniden başlattıktan sonra Hücre 1'i TEKRAR ÇALIŞTIRMAYIN,           !!!")
print("!!! doğrudan Hücre 2'ye (Kütüphane Importları) geçin.                   !!!")
print("!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!")

### Hücre 2: Kütüphanelerin Import Edilmesi, Versiyon Kontrolü ve Cihaz Belirleme (ViT için)

* **Amaç:**
    Çalışma zamanı yeniden başlatıldıktan sonra, Hücre 1'de kurulan ve Colab'da zaten mevcut olan temel kütüphaneleri Python çalışma ortamına dahil etmek. Görüntü sınıflandırma projesi için gerekli olan `torchvision` gibi kütüphanelerin de doğru import edildiğini teyit etmek. Kullanılan tüm ana kütüphanelerin versiyonlarını kontrol ederek tekrarlanabilirliği sağlamak ve projenin hangi sürümlerle geliştirildiğini belgelemek. Model eğitimi ve çıkarımı için kullanılacak donanım cihazını (CPU veya GPU) belirlemek.

* **Yapılan İşlemler:**
    1.  Gerekli tüm kütüphaneler (`transformers`, `datasets`, `torch`, `torchvision`, `numpy`, `pandas`, `sklearn`, `matplotlib`, `PIL` (Pillow), `sys`, `time`) `import` edilir.
    2.  Hugging Face `datasets` ve `transformers` kütüphanelerinden ViT için sık kullanılacak sınıflar (örn: `load_dataset`, `AutoImageProcessor` veya `ViTImageProcessor`, `AutoModelForImageClassification` veya `ViTForImageClassification`, `TrainingArguments`, `Trainer`) ayrıca import edilir veya edileceği belirtilir.
    3.  GPU varlığı `torch.cuda.is_available()` ile saptanır ve `device` değişkeni `cuda` veya `cpu` olarak ayarlanır.
    4.  İsteğe bağlı olarak Python uyarıları bastırılır.
    5.  Import edilen ana kütüphanelerin versiyonları ekrana yazdırılır. Özellikle `torch`, `torchvision`, `transformers`, `datasets` ve `numpy` versiyonları önemlidir.
    6.  Kullanılacak cihaz ve eğer GPU aktifse ek CUDA/cuDNN bilgileri gösterilir.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * Bu hücrenin sorunsuz çalışması, Hücre 1'deki kurulumların ve ardından yapılan çalışma zamanı yeniden başlatmanın ortamı ViT projesi için doğru şekilde hazırladığını gösterir.
    * Çıktıda listelenen kütüphane versiyonları, projenin bu bölümünün hangi ortamda geliştirildiğini belgeler. Önceki başarılı projelerimizden elde ettiğimiz `datasets==3.6.0`, `transformers==4.48.3` ve uyumlu bir NumPy versiyonu (Colab'ın o anki varsayılanı) burada da görülmesi ve tüm importların hatasız olması beklenir.
    * "KULLANILACAK CİHAZ" satırında `cuda` (eğer Colab'da GPU aktifse) veya `cpu` yazar. Görüntü işleme modellerinin eğitimi genellikle GPU üzerinde çok daha verimlidir.

In [None]:
# Hücre 2: Kütüphanelerin Import Edilmesi, Versiyon Kontrolü ve Cihaz Belirleme (ViT için)

# Temel ve Hugging Face kütüphanelerinin import edilmesi
import transformers
import datasets
import torch
import torchvision # Görüntü işleme ve veri setleri için PyTorch kütüphanesi
import numpy as np
import pandas as pd
import sklearn # scikit-learn'ün ana modülü
import matplotlib
import matplotlib.pyplot as plt # matplotlib.pyplot'ı ayrıca import etmek iyi bir pratiktir
import seaborn as sns
from PIL import Image # Pillow kütüphanesi görüntü açma/işleme için
import sys    # Python versiyonunu almak için
import time   # Süre ölçümleri için

# Hugging Face kütüphanelerinden sık kullanılacak modüller (ilerleyen aşamalarda)
from datasets import load_dataset
# ViT için genellikle AutoImageProcessor veya ViTImageProcessor kullanılır
# from transformers import AutoImageProcessor, ViTImageProcessor
# from transformers import AutoModelForImageClassification, ViTForImageClassification
# from transformers import TrainingArguments, Trainer

# Cihazı belirleme: GPU varsa GPU, yoksa CPU kullanılacak.
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# İsteğe bağlı: Daha temiz bir çıktı için uyarıları bastırma
import warnings
warnings.filterwarnings("ignore", category=UserWarning)
warnings.filterwarnings("ignore", category=FutureWarning)

print("Kütüphaneler başarıyla import edildi.")
print("-" * 50)
print("KULLANILAN KÜTÜPHANE VERSİYONLARI:")
print(f"  Python Versiyonu (sys.version): {sys.version.split()[0]}")
print(f"  PyTorch: {torch.__version__}")
print(f"  Torchvision: {torchvision.__version__}")
print(f"  Transformers: {transformers.__version__}")
print(f"  Datasets: {datasets.__version__}")
print(f"  Numpy: {np.__version__}")
print(f"  Pandas: {pd.__version__}")
print(f"  Scikit-learn: {sklearn.__version__}")
print(f"  Matplotlib: {matplotlib.__version__}")
print(f"  Seaborn: {sns.__version__}")
print(f"  Pillow (PIL): {Image.__version__}")
print("-" * 50)
print(f"KULLANILACAK CİHAZ: {device}")
print("-" * 50)

if device.type == 'cuda':
    print(f"  CUDA Versiyonu (torch.version.cuda): {torch.version.cuda}")
    print(f"  cuDNN Versiyonu (torch.backends.cudnn.version()): {torch.backends.cudnn.version()}")
    print(f"  Kullanılabilir GPU Sayısı: {torch.cuda.device_count()}")
    if torch.cuda.device_count() > 0:
        print(f"  Aktif GPU Adı: {torch.cuda.get_device_name(0)}")
    print("-" * 50)
else:
    print("Uyarı: GPU bulunamadı veya aktif değil. Model eğitimi CPU üzerinde daha yavaş olacaktır.")
    print("Colab'da GPU'yu aktifleştirmek için 'Runtime' -> 'Change runtime type' menüsünü kullanabilirsiniz.")
    print("-" * 50)

### Hücre 3: Görüntü Veri Setinin Yüklenmesi (CIFAR-10) ve Temel İnceleme

* **Amaç:**
    Vision Transformer (ViT) ile görüntü sınıflandırma görevi için standart bir benchmark olan CIFAR-10 veri setini Hugging Face `datasets` kütüphanesiyle yüklemek. Veri setinin yapısını, içerdiği özellikleri (görüntü ve etiket), sınıf sayısını, etiket isimlerini anlamak ve örnek görüntüleri görselleştirerek veri hakkında fikir edinmek.

* **Yapılan İşlemler:**
    1.  `load_dataset("cifar10")` fonksiyonu kullanılarak CIFAR-10 veri seti (`dataset_cifar_raw` olarak) Hugging Face Hub'dan yüklenir. Bu veri seti genellikle `train` ve `test` olmak üzere iki alt küme içerir.
    2.  Yüklenen ham `DatasetDict` yapısı (alt kümeler, her bir alt kümedeki özellikler ve örnek sayıları) ekrana yazdırılır. Özellikle `img` (görüntü) ve `label` (sınıf etiketi) özellikleri incelenir.
    3.  Eğitim setindeki `label` özelliğinden (`dataset_cifar_raw['train'].features['label']`) `ClassLabel` objesi alınır ve `label_feature_cifar` adlı bir değişkende saklanır. Bu obje, etiketlerin metin karşılıklarını (`names`) ve toplam sınıf sayısını (`num_classes`) içerir.
    4.  Eğitim setinden rastgele birkaç örnek görüntü seçilir ve `matplotlib.pyplot` kullanılarak etiketleriyle birlikte görselleştirilir. Bu, veri setindeki görüntülerin nasıl göründüğü ve etiketlerin doğruluğu hakkında fikir verir.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * CIFAR-10 veri setinin Hugging Face Hub'dan sorunsuz bir şekilde indirilip yüklenmesi.
    * `DatasetDict` yapısının `train` (genellikle 50,000 örnek) ve `test` (genellikle 10,000 örnek) alt kümelerini içerdiğinin görülmesi.
    * `img` özelliğinin `PIL.Image.Image` formatında, `label` özelliğinin ise 10 sınıflı bir `ClassLabel` olduğu teyit edilir. Etiket isimleri (örn: "airplane", "automobile", "bird" vb.) listelenir.
    * Rastgele seçilen CIFAR-10 görüntülerinin etiketleriyle birlikte doğru bir şekilde gösterilmesi.
    * Bu hücre, `dataset_cifar_raw` ve `label_feature_cifar` gibi sonraki adımlarda kullanılacak temel değişkenleri tanımlayacaktır.

In [None]:
# Hücre 3: Görüntü Veri Setinin Yüklenmesi (CIFAR-10) ve Temel İnceleme

from datasets import load_dataset
import matplotlib.pyplot as plt # Görselleştirme için
import numpy as np # Rastgele seçim ve görüntü işleme için
import random # Rastgele örnek seçmek için

# CIFAR-10 veri setini yükleyelim
dataset_name_cifar = "cifar10"

print(f"'{dataset_name_cifar}' veri seti yükleniyor...")
try:
    # dataset_cifar_raw'ı global yapalım
    global dataset_cifar_raw
    dataset_cifar_raw = load_dataset(dataset_name_cifar)

    print(f"\n'{dataset_name_cifar}' veri seti başarıyla yüklendi.")
    print("\nYüklenen Ham Veri Seti Yapısı:")
    print(dataset_cifar_raw)

    # Eğitim setinin özelliklerini inceleyelim
    # Önce hangi split'lerin olduğunu kontrol edelim.
    available_splits_cifar = list(dataset_cifar_raw.keys())
    if not available_splits_cifar:
        raise ValueError("CIFAR-10 veri setinde hiçbir alt küme (split) bulunamadı.")

    split_to_inspect_cifar = 'train' if 'train' in available_splits_cifar else available_splits_cifar[0]

    print(f"\n'{split_to_inspect_cifar}' alt kümesinin özellikleri (features):")
    print(dataset_cifar_raw[split_to_inspect_cifar].features)

    # Etiket bilgisini alalım (label_feature_cifar'ı global yapalım)
    global label_feature_cifar
    if 'label' in dataset_cifar_raw[split_to_inspect_cifar].features:
        label_feature_cifar = dataset_cifar_raw[split_to_inspect_cifar].features['label']
        print(f"\nEtiket Bilgisi ('label' özelliği):")
        print(label_feature_cifar)
        if hasattr(label_feature_cifar, 'names'):
            print(f"Toplam etiket sayısı: {label_feature_cifar.num_classes}")
            print(f"Etiket isimleri: {label_feature_cifar.names}")
        else:
            print("Uyarı: 'label' özelliği bir ClassLabel değil gibi görünüyor veya 'names' attribute'u yok.")
    else:
        print("Uyarı: Veri setinde 'label' özelliği bulunamadı.")
        label_feature_cifar = None

    # Eğitim setinden rastgele birkaç örnek görselleştirelim
    if split_to_inspect_cifar in dataset_cifar_raw and len(dataset_cifar_raw[split_to_inspect_cifar]) > 0 and \
       label_feature_cifar is not None and hasattr(label_feature_cifar, 'names'):

        print(f"\n'{split_to_inspect_cifar}' setinden rastgele örnek görüntüler:")

        num_samples_to_show = 5
        # Rastgele indeksler seçelim
        random_indices = random.sample(range(len(dataset_cifar_raw[split_to_inspect_cifar])), num_samples_to_show)

        plt.figure(figsize=(15, 3)) # Figür boyutunu ayarla
        for i, idx in enumerate(random_indices):
            sample = dataset_cifar_raw[split_to_inspect_cifar][idx]
            image = sample["img"] # Bu bir PIL Image objesi olmalı
            label_id = sample["label"]
            label_name = label_feature_cifar.int2str(label_id)

            plt.subplot(1, num_samples_to_show, i + 1)
            plt.imshow(image)
            plt.title(f"Etiket: {label_name}\n(ID: {label_id})")
            plt.axis("off")
        plt.show()
    else:
        print(f"\n'{split_to_inspect_cifar}' seti boş, bulunamadı veya etiket bilgisi eksik; örnekler gösterilemiyor.")

except Exception as e:
    print(f"\nVeri seti yüklenirken veya işlenirken bir hata oluştu: {e}")
    import traceback
    print(traceback.format_exc())
    if 'dataset_cifar_raw' in globals(): del dataset_cifar_raw
    if 'label_feature_cifar' in globals(): del label_feature_cifar

### Hücre 4: Görüntü Veri Seti İçin Veri Ön İşleme ve Augmentasyon (ViT için - `KeyError` Düzeltmesi)

* **Amaç:**
    CIFAR-10 veri setini Vision Transformer (ViT) modelinin eğitimi ve değerlendirmesi için hazırlamak. Bu, bir doğrulama seti oluşturmayı, uygun bir görüntü işlemcisi (image processor) kullanarak görüntüleri ViT'nin beklediği formata (boyut, normalizasyon) getirmeyi ve eğitim setine veri augmentasyonu uygulayarak modelin genelleme yeteneğini artırmayı içerir. Bir önceki denemede `image_processor.size["shortest_edge"]` erişiminde `KeyError` alınmıştı, bu düzeltilecektir. `image_processor.size` genellikle `{'height': Y, 'width': X}` şeklinde bir sözlüktür.

* **Yapılan İşlemler:**
    1.  **Doğrulama Seti Oluşturma:** `dataset_cifar_raw['train']` alt kümesi, %90 eğitim ve %10 doğrulama olarak bölünür.
    2.  **Image Processor Yükleme:** ViT modeli (`"google/vit-base-patch16-224"`) için `AutoImageProcessor` yüklenir.
    3.  **Veri Dönüşümleri (Transforms) Tanımlama:**
        * `image_processor`'ın kendisi, görüntüleri PIL formatından alıp gerekli tüm temel dönüşümleri (yeniden boyutlandırma, normalizasyon, tensöre çevirme) yapar.
        * **Eğitim Seti İçin (`preprocess_train`):** Önce `torchvision.transforms` ile augmentasyonlar (örn: `RandomResizedCrop`, `RandomHorizontalFlip`) PIL görüntülerine uygulanır, ardından bu augmentasyon görmüş görüntüler `image_processor`'a verilerek tensörlere dönüştürülür.
        * **Değerlendirme/Test Setleri İçin (`preprocess_eval`):** Görüntüler doğrudan `image_processor`'a verilerek gerekli boyutlandırma, normalizasyon ve tensör dönüşümü yapılır (augmentasyon uygulanmaz).
            * **Düzeltme:** `Resize` ve `CenterCrop` için `image_processor.size` sözlüğündeki `height` ve `width` anahtarları doğru kullanılacaktır. ViT genellikle kare girdiler beklediği için, `image_processor.size['height']` (veya `image_processor.size['width']`) genellikle tek bir değere (örn: 224) karşılık gelir. `Resize` için bu tek değer veya `(değer, değer)` tupl'ı kullanılır.
    4.  **Dönüşümleri Veri Setine Uygulama:** Tanımlanan `preprocess_train` ve `preprocess_eval` fonksiyonları, `processed_dataset_cifar`'ın ilgili alt kümelerine `.set_transform()` metodu ile atanır.
    5.  Dönüştürülmüş bir örnek kontrol edilir.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * Veri setleri ve image processor başarıyla yüklenir.
    * `KeyError: 'shortest_edge'` hatasının düzeltilmesiyle, değerlendirme seti için dönüşümler doğru tanımlanır. `image_processor.size` genellikle `{"height": 224, "width": 224}` gibi değerler içerir. `Resize` ve `CenterCrop` için bu değerler kullanılacaktır.
    * `.set_transform()` ile atanan dönüşümler sayesinde, `DataLoader`'dan gelen her bir batch'teki görüntülerin modele uygun boyutta, normalize edilmiş ve PyTorch tensörleri formatında olması sağlanır.
    * Dönüştürülmüş bir örneğin `pixel_values` (genellikle `(3, Yükseklik, Genişlik)` örn: `(3, 224, 224)`) ve `labels` anahtarlarını içerdiği görülür.

In [None]:
# Hücre 4: Görüntü Veri Seti İçin Veri Ön İşleme ve Augmentasyon (ViT için - KeyError Düzeltmesiyle)

from transformers import AutoImageProcessor
from torchvision.transforms import ( # Bu importlar, eğer manuel augmentasyon yapacaksak gerekli
    Compose, RandomResizedCrop, RandomHorizontalFlip, ToTensor, Normalize,
    Resize, CenterCrop
)
# datasets, torch, np, plt zaten Hücre 2'de import edilmişti.
# dataset_cifar_raw ve label_feature_cifar Hücre 3'ten gelmeli.

vit_checkpoint = "google/vit-base-patch16-224"

if 'dataset_cifar_raw' in globals() and dataset_cifar_raw is not None and \
   'label_feature_cifar' in globals() and label_feature_cifar is not None:
    print("CIFAR-10 veri seti ön işleme adımları başlatılıyor...")

    # 1. Doğrulama Seti Oluşturma
    if 'train' in dataset_cifar_raw and 'test' in dataset_cifar_raw:
        train_val_split = dataset_cifar_raw['train'].train_test_split(test_size=0.1, seed=42, stratify_by_column="label")

        global processed_dataset_cifar
        processed_dataset_cifar = datasets.DatasetDict({
            'train': train_val_split['train'],
            'validation': train_val_split['test'],
            'test': dataset_cifar_raw['test']
        })
        print("\nEğitim seti, doğrulama ve test alt kümelerine ayrıldı:")
        print(processed_dataset_cifar)
        print(f"  Yeni Eğitim seti örnek sayısı: {len(processed_dataset_cifar['train'])}")
        print(f"  Doğrulama seti örnek sayısı: {len(processed_dataset_cifar['validation'])}")
    else:
        print("Hata: Ham CIFAR-10 veri setinde 'train' veya 'test' alt kümesi bulunamadı.")
        processed_dataset_cifar = None

    if processed_dataset_cifar is not None:
        # 2. Image Processor Yükleme
        try:
            global image_processor
            image_processor = AutoImageProcessor.from_pretrained(vit_checkpoint)
            print(f"\n'{vit_checkpoint}' için Image Processor başarıyla yüklendi.")
            # image_processor.size genellikle {'height': 224, 'width': 224} gibi bir sözlüktür.
            # Veya bazen sadece image_processor.size integer olabilir (örn: 224).
            # ViT modelleri genellikle kare girdiler bekler (örn: 224x224).
            # `size` attribute'unun yapısını kontrol edelim.
            # Genellikle image_processor.size bir int (örn: 224) veya {'shortest_edge': 224}
            # veya {'height': 224, 'width': 224} döndürür.
            # ViTImageProcessor için .size genellikle bir int'dir.
            # AutoImageProcessor.from_pretrained("google/vit-base-patch16-224").size -> 224
            # Dolayısıyla, image_processor.size["height"] veya image_processor.size["shortest_edge"] yerine
            # doğrudan image_processor.size (eğer int ise) veya image_processor.size['height'] (eğer dict ise) kullanmalıyız.
            # ViTFeatureExtractor (eski adı) için size bir int idi.
            # ViTImageProcessor için, size attribute'u içinde 'height', 'width' veya 'shortest_edge' olabilir,
            # ya da doğrudan bir int olabilir.
            # En güvenlisi, processor'ın döndürdüğü config'e bakmak veya doğrudan size'ı kullanmak.
            # `google/vit-base-patch16-224` için image_processor.size = {'height': 224, 'width': 224}
            # Ancak hata `shortest_edge` için geldi. Bu, benim önceki kodumdaki bir varsayımdı.
            # Doğrusu, ViT için genellikle kare bir çözünürlük vardır.

            # image_processor.size'ın yapısını kontrol edelim:
            # print(f"Image processor size bilgisi: {image_processor.size}")
            # Çıktı genellikle şöyledir: {'height': 224, 'width': 224}
            # veya bazen sadece int: 224
            # ViT için genellikle kare olduğu için tek bir boyut (örn: 224) yeterlidir.
            # Eğer image_processor.size bir sözlükse:
            if isinstance(image_processor.size, dict):
                target_size = (image_processor.size['height'], image_processor.size['width'])
                crop_size = image_processor.size['height'] # Kare olduğu varsayımıyla
            else: # Eğer int ise
                target_size = (image_processor.size, image_processor.size)
                crop_size = image_processor.size

            print(f"  Hedef görüntü boyutu: {target_size}")


        except Exception as e:
            print(f"Image processor yüklenirken veya size bilgisi alınırken hata: {e}")
            image_processor = None

        if image_processor is not None:
            # 3. Veri Dönüşümleri (Transforms) Tanımlama

            # Eğitim seti için dönüşüm fonksiyonu
            def preprocess_train(example_batch):
                # example_batch['img'] bir PIL Image listesi olmalı
                # ViT image_processor genellikle PIL görüntülerini veya NumPy dizilerini girdi olarak alır
                # ve normalizasyon ile tensör dönüşümünü kendi içinde yapar.
                # Augmentasyonları image_processor'DAN ÖNCE uygulamalıyız.

                # Torchvision augmentasyonları
                augmentations = Compose([
                    RandomResizedCrop(size=target_size, scale=(0.8, 1.0)), # Boyut ve ölçek aralığı ayarlanabilir
                    RandomHorizontalFlip(),
                ])

                # Augmentasyonları uygula
                # example_batch['img'] bir liste ise, her birine uygulamalıyız
                try:
                    augmented_images = [augmentations(img.convert("RGB")) for img in example_batch['img']]
                except TypeError: # Eğer tek bir görüntü geliyorsa (batched=False ile map yapılırsa)
                    augmented_images = augmentations(example_batch['img'].convert("RGB"))


                # Image processor'ı uygula
                inputs = image_processor(images=augmented_images, return_tensors="pt")
                inputs['labels'] = example_batch['label']
                return inputs

            # Değerlendirme seti için dönüşüm fonksiyonu
            def preprocess_eval(example_batch):
                # Değerlendirme için sadece boyutlandırma ve normalizasyon (image_processor yapar)
                # Görüntülerin RGB olduğundan emin olalım
                try:
                    rgb_images = [img.convert("RGB") for img in example_batch['img']]
                except TypeError:
                    rgb_images = example_batch['img'].convert("RGB")

                inputs = image_processor(images=rgb_images, return_tensors="pt")
                inputs['labels'] = example_batch['label']
                return inputs

            print("\nVeri setlerine dönüşümler atanıyor...")
            try:
                # processed_dataset_cifar['train'].set_transform(preprocess_train, output_all_columns=False) # Hatalı kullanım
                # Doğru kullanım:
                processed_dataset_cifar['train'] = processed_dataset_cifar['train'].with_transform(preprocess_train)
                processed_dataset_cifar['validation'] = processed_dataset_cifar['validation'].with_transform(preprocess_eval)
                processed_dataset_cifar['test'] = processed_dataset_cifar['test'].with_transform(preprocess_eval)

                print("Dönüşümler başarıyla atandı.")

                print("\nDönüşümler atandı. Eğitim setinden bir örnek (dönüşüm sonrası) alınıyor:")
                sample_transformed = processed_dataset_cifar["train"][0]
                print(f"  Dönüştürülmüş örnek anahtarları: {list(sample_transformed.keys())}")
                if 'pixel_values' in sample_transformed:
                    print(f"  pixel_values şekli: {sample_transformed['pixel_values'].shape}")
                if 'labels' in sample_transformed:
                    print(f"  labels değeri: {sample_transformed['labels']}")
            except Exception as e_set_transform:
                print(f"Dönüşümler atanırken veya örnek alınırken hata: {e_set_transform}")
                import traceback
                print(traceback.format_exc())


            print("\nVeri ön işleme ve augmentasyon (Hücre 4) tamamlandı.")
        else:
            print("Image processor yüklenemediği için veri dönüşümleri tanımlanamadı.")
else:
    print("Hata: CIFAR-10 veri seti ('dataset_cifar_raw') veya etiket bilgisi ('label_feature_cifar') bulunamadı.")

### Hücre 5: Vision Transformer (ViT) Modelinin Yüklenmesi

* **Amaç:**
    Görüntü sınıflandırma görevimiz (CIFAR-10) için önceden eğitilmiş bir Vision Transformer (ViT) modelini yüklemek ve veri setimizdeki sınıf sayısına (10 sınıf) uygun bir sınıflandırma başlığı (classification head) ile yapılandırmak.

* **Yapılan İşlemler:**
    1.  Hugging Face `transformers` kütüphanesinden `AutoModelForImageClassification` sınıfı kullanılacaktır. Bu sınıf, belirtilen bir checkpoint'ten önceden eğitilmiş bir görüntü modelini yükler ve üzerine bir görüntü sınıflandırma başlığı ekler.
    2.  `vit_checkpoint` olarak Hücre 4'te image processor için kullandığımız `"google/vit-base-patch16-224"` (veya benzeri, ImageNet üzerinde önceden eğitilmiş bir ViT modeli) kullanılacaktır.
    3.  `num_labels` parametresi, modelin sınıflandırma başlığının kaç çıktı nöronuna sahip olacağını belirtir. Bu değer, Hücre 3'te `label_feature_cifar.num_classes` ile elde ettiğimiz CIFAR-10 veri setindeki toplam sınıf sayısına (10) eşit olacaktır.
    4.  **`ignore_mismatched_sizes=True`** parametresi, `from_pretrained` metoduna eklenecektir. Önceden eğitilmiş ViT modeli (örn: ImageNet üzerinde 1000 sınıf veya 21k sınıf için eğitilmiş) yüklenirken, bizim görevimiz için (CIFAR-10'da 10 sınıf) farklı sayıda etikete sahip bir sınıflandırma başlığına ihtiyaç duyulacaktır. `ignore_mismatched_sizes=True`, Hugging Face'in orijinal sınıflandırma başlığını atıp, `num_labels` ile belirttiğimiz sayıda sınıfa uygun, rastgele başlatılmış yeni bir sınıflandırma başlığı eklemesini sağlar. Bu, ince ayar (fine-tuning) için doğru yaklaşımdır.
    5.  Yüklenen model, `model_vit.to(device)` komutu ile Hücre 2'de belirlenen cihaza (GPU: `cuda` veya CPU) taşınır.
    6.  Modelin başarıyla yüklendiği, doğru cihaza taşındığı, toplam ve eğitilebilir parametre sayısı ve sınıflandırıcısının doğru sayıda etiket için (10) yapılandırıldığı teyit edilir.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * `"google/vit-base-patch16-224"` modelinin ağırlıkları Hugging Face Hub'dan indirilir.
    * Çıktıda, sınıflandırma katmanının ağırlıklarının rastgele başlatıldığına ve modelin bu görev için eğitilmesi (fine-tuning) gerektiğine dair bir uyarı (`Some weights ... were not initialized...` veya `... newly initialized ...`) görülür. Bu, yeni bir görev için modelin üzerine yeni bir başlık eklendiğinde beklenen bir durumdur.
    * Modelin GPU'ya başarıyla taşındığı belirtilir.
    * Modeldeki toplam parametre sayısı (ViT-Base için ~86 milyon) ve bu parametrelerin büyük bir kısmının eğitilebilir olduğu gösterilir.
    * Modelin yapılandırmasındaki (`model_vit.config.num_labels`) ve sınıflandırıcı katmanındaki etiket sayısının, veri setimizdeki sınıf sayısıyla (10) eşleştiği doğrulanır.
    * `model_vit` adlı değişken, eğitilmek üzere hazır hale gelir.

In [None]:
# Hücre 5: Vision Transformer (ViT) Modelinin Yüklenmesi

from transformers import AutoModelForImageClassification

# vit_checkpoint Hücre 4'te tanımlanmıştı: "google/vit-base-patch16-224"
# label_feature_cifar Hücre 3'te tanımlanmıştı ve sınıf sayısını içeriyordu.
# device Hücre 2'de tanımlanmıştı.

if 'vit_checkpoint' in globals() and \
   'label_feature_cifar' in globals() and label_feature_cifar is not None and hasattr(label_feature_cifar, 'num_classes') and \
   'device' in globals():

    num_classes_cifar = label_feature_cifar.num_classes
    print(f"'{vit_checkpoint}' modeli '{num_classes_cifar}' etiket ile görüntü sınıflandırma görevi için yükleniyor...")

    try:
        # model_vit'i global yapalım
        global model_vit
        model_vit = AutoModelForImageClassification.from_pretrained(
            vit_checkpoint,
            num_labels=num_classes_cifar,
            ignore_mismatched_sizes=True, # Önceden eğitilmiş başlığın boyutunu önemseme, bizim num_labels'a göre yeni başlık oluştur.
        )

        model_vit.to(device) # Modeli tanımlanan cihaza (GPU/CPU) taşı

        print(f"\nModel başarıyla yüklendi ve '{device}' cihazına taşındı.")

        total_params = sum(p.numel() for p in model_vit.parameters())
        trainable_params = sum(p.numel() for p in model_vit.parameters() if p.requires_grad)
        print(f"\nModeldeki toplam parametre sayısı: {total_params:,}")
        print(f"Modeldeki eğitilebilir parametre sayısı: {trainable_params:,}")

        # Modelin ve sınıflandırıcısının doğru sayıda etiket için yapılandırıldığını doğrula
        if hasattr(model_vit.config, 'num_labels'):
            print(f"Modelin yapılandırmasındaki etiket sayısı: {model_vit.config.num_labels}")

        # ViTForImageClassification'da sınıflandırıcı katmanı genellikle 'classifier' adındadır
        # ve bir nn.Linear katmanıdır.
        if hasattr(model_vit, 'classifier') and isinstance(model_vit.classifier, torch.nn.Linear):
             print(f"Sınıflandırıcı katmanının ('classifier') çıktı boyutu: {model_vit.classifier.out_features}")
        else:
            # Farklı bir ViT varyantı veya özel bir başlık olabilir, son katmanı bulmaya çalışalım
            final_layer = None
            for _, module in reversed(list(model_vit.named_modules())):
                if isinstance(module, torch.nn.Linear):
                    final_layer = module
                    break
            if final_layer is not None:
                print(f"Modelin son Linear katmanının çıktı boyutu: {final_layer.out_features}")
                if final_layer.out_features != num_classes_cifar:
                    print(f"UYARI: Son linear katman çıktı boyutu ({final_layer.out_features}) num_labels ({num_classes_cifar}) ile eşleşmiyor!")
            else:
                print("Sınıflandırıcı katmanının çıktı boyutu otomatik olarak tespit edilemedi, ancak num_labels doğru ayarlanmış olmalı.")


    except Exception as e:
        print(f"\nViT Modeli yüklenirken bir hata oluştu: {e}")
        import traceback
        print(traceback.format_exc())
        if 'model_vit' in globals(): del model_vit
else:
    print("Hata: Gerekli değişkenler ('vit_checkpoint', 'label_feature_cifar', 'device') bulunamadı.")
    if 'model_vit' in globals(): del model_vit

### Hücre 6: Eğitim Argümanları, Metrikler ve ViT Modelinin Eğitilmesi

* **Amaç:**
    Önceden eğitilmiş Vision Transformer (ViT) modelini, hazırladığımız CIFAR-10 veri seti üzerinde ince ayar (fine-tuning) yaparak görüntü sınıflandırma görevi için eğitmek. Eğitim sürecini kontrol edecek hiperparametreleri ayarlamak, her epoch sonunda model performansını izlemek için metrikleri hesaplamak ve en iyi modeli kaydetmek.

* **Yapılan İşlemler:**
    1.  **Performans Metriklerini Hesaplama Fonksiyonu (`compute_metrics_image_clf`):**
        * `Trainer` tarafından her değerlendirme adımında çağrılacak bir fonksiyon tanımlanır.
        * Girdi olarak modelin tahminlerini (`pred.predictions` - logitler) ve gerçek etiketleri (`pred.label_ids`) alır.
        * `sklearn.metrics` kullanılarak proje isterlerinde belirtilen sınıflandırma metrikleri hesaplanır:
            * **Accuracy:** Genel doğruluk.
            * **Precision, Recall, F1-Score:** Bu metrikler çok sınıflı (10 sınıf) görevimiz için `average='macro'` (her sınıfın metriğini hesaplayıp ağırlıksız ortalamasını alır) veya `average='weighted'` (sınıf büyüklüğüne göre ağırlar) parametresiyle hesaplanır. `'macro'` F1 genellikle dengesiz olmayan veya tüm sınıfların eşit önemli olduğu durumlarda tercih edilir.
            * **Specificity:** Çok sınıflı durumda her sınıf için ayrı ayrı (one-vs-rest mantığıyla) TN/(TN+FP) hesaplanıp ortalaması alınabilir.
            * **AUC:** Çok sınıflı durumda ROC AUC, genellikle her sınıf için One-vs-Rest (OvR) stratejisiyle hesaplanır ve ortalaması alınır (`roc_auc_score(..., multi_class='ovr', average='macro')`).
        * Hesaplanan metrikler bir sözlük olarak döndürülür.
    2.  **`TrainingArguments` Tanımlanması:**
        * Model eğitimi için ayarlar belirlenir:
            * `output_dir`: Sonuçların kaydedileceği dizin (örn: `"./vit_cifar10_results"`).
            * `num_train_epochs`: Epoch sayısı (görüntü modelleri için 5-10 veya daha fazla denenebilir).
            * `per_device_train_batch_size` / `per_device_eval_batch_size`: Batch boyutları (GPU belleğine göre ayarlanır; ViT modelleri ve görüntü verileri için dikkatli seçilmelidir, örn: 32/64 veya 16/32).
            * `evaluation_strategy="epoch"`: Her epoch sonunda doğrulama seti üzerinde değerlendirme yapılır.
            * `save_strategy="epoch"`: Her epoch sonunda model checkpoint'i kaydedilir.
            * `load_best_model_at_end=True` ve `metric_for_best_model`: Eğitim sonunda en iyi modeli (örn: "eval\_accuracy" veya "eval\_f1_macro") yükler.
            * Diğer parametreler: `logging_strategy`, `learning_rate`, `weight_decay`, `warmup_steps`, `save_total_limit`.
    3.  **Veri Harmanlama Fonksiyonu (`collate_fn`):**
        * `Trainer` API'si, görüntü verilerini ve etiketlerini batch'ler halinde doğru bir şekilde birleştirmek için bir `collate_fn`'e ihtiyaç duyar. Hugging Face `transformers` genellikle `default_data_collator` sağlar. Eğer `image_processor` ile `.set_transform` kullanarak verileri zaten PyTorch tensörlerine (`pixel_values`, `labels`) dönüştürdüysek, `default_data_collator` genellikle yeterli olacaktır.
    4.  **`Trainer` Objesinin Oluşturulması:**
        * Parametreleri: `model_vit` (Hücre 5'te yüklenen), `args` (`TrainingArguments`), `processed_dataset_cifar["train"]`, `processed_dataset_cifar["validation"]`, `image_processor` (tokenizer olarak), `compute_metrics_image_clf` fonksiyonu ve `data_collator`.
    5.  **Modelin Eğitilmesi:**
        * `trainer_vit.train()` metodu ile model eğitimi başlatılır.
        * Eğitim süresi ölçülür ve eğitim sonunda genel metrikler ile en iyi modelin kaydedildiği yol yazdırılır.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * `TrainingArguments` tanımlanır ve `Trainer` objesi başarıyla oluşturulur.
    * Eğitim başlar. Her epoch sonunda eğitim kaybı, doğrulama kaybı ve `compute_metrics_image_clf` ile hesaplanan diğer doğrulama metrikleri loglanır.
    * Eğitim tamamlandığında, en iyi performansı veren model `trainer_vit.model` içinde yüklü olur ve belirtilen yola kaydedilir.
    * Bu hücre, ViT modelinin CIFAR-10 görüntü sınıflandırma görevinde ne kadar başarılı olduğunu ve öğrenme sürecini anlamamızı sağlar.

In [None]:
# Hücre 6: Eğitim Argümanları, Metrikler ve ViT Modelinin Eğitilmesi (Düzeltilmiş `remove_unused_columns` ile)

from transformers import TrainingArguments, Trainer, default_data_collator
from sklearn.metrics import accuracy_score, precision_recall_fscore_support, roc_auc_score, confusion_matrix
# numpy, torch, time, label_feature_cifar, model_vit, processed_dataset_cifar, image_processor, device
# gibi değişkenlerin önceki hücrelerde doğru şekilde tanımlandığını varsayıyoruz.

# 1. Performans Metriklerini Hesaplama Fonksiyonu (Görüntü Sınıflandırması İçin - öncekiyle aynı)
def compute_metrics_image_clf(pred):
    labels = pred.label_ids
    preds = pred.predictions.argmax(-1)
    current_num_classes = label_feature_cifar.num_classes if 'label_feature_cifar' in globals() and label_feature_cifar else 10
    precision_macro, recall_macro, f1_macro, _ = precision_recall_fscore_support(labels, preds, average='macro', zero_division=0)
    acc = accuracy_score(labels, preds)
    try:
        cm = confusion_matrix(labels, preds, labels=list(range(current_num_classes)))
        tn, fp, fn, tp = 0,0,0,0 # Bu hesaplama çok sınıflı için daha karmaşık, specificity için farklı bir yol izleyelim
        per_class_specificity_list = []
        for i in range(current_num_classes):
            temp_tn = np.sum(cm) - (np.sum(cm[i,:]) + np.sum(cm[:,i]) - cm[i,i])
            temp_fp = np.sum(cm[:,i]) - cm[i,i]
            if (temp_tn + temp_fp) > 0:
                per_class_specificity_list.append(temp_tn / (temp_tn + temp_fp))
            else:
                per_class_specificity_list.append(0.0)
        specificity_macro = np.mean(per_class_specificity_list) if per_class_specificity_list else 0.0
    except ValueError:
        specificity_macro = 0.0
    auc_macro = 0.0
    if pred.predictions.ndim == 2 and pred.predictions.shape[1] == current_num_classes:
        try:
            logits_tensor = torch.tensor(pred.predictions)
            probs = torch.softmax(logits_tensor, dim=-1).cpu().numpy()
            auc_macro = roc_auc_score(labels, probs, multi_class='ovr', average='macro', labels=list(range(current_num_classes)))
        except ValueError: auc_macro = 0.0
    return {
        'accuracy': acc, 'precision_macro': precision_macro, 'recall_macro': recall_macro,
        'f1_macro': f1_macro, 'specificity_macro': specificity_macro, 'auc_macro': auc_macro
    }

# 2. Eğitim Argümanları (TrainingArguments) - DÜZELTİLMİŞ
training_args_vit = TrainingArguments(
    output_dir="./vit_cifar10_results_v2", # Farklı bir çıktı dizini
    num_train_epochs=10,
    per_device_train_batch_size=32,
    per_device_eval_batch_size=64,
    learning_rate=2e-5,
    warmup_ratio=0.1,
    weight_decay=0.01,
    logging_strategy="epoch",
    evaluation_strategy="epoch",
    save_strategy="epoch",
    load_best_model_at_end=True,
    metric_for_best_model="accuracy",
    save_total_limit=2,
    report_to="tensorboard",
    remove_unused_columns=False, # <<-- ÖNEMLİ DÜZELTME: Transform fonksiyonunun 'img' sütununa erişebilmesi için.
    # fp16=torch.cuda.is_available(),
)

print(f"\nEğitim argümanları (ViT için - remove_unused_columns=False ile) tanımlandı. Çıktı dizini: {training_args_vit.output_dir}")

# 3. Trainer Objesinin Oluşturulması
if 'model_vit' in globals() and model_vit is not None and \
   'processed_dataset_cifar' in globals() and processed_dataset_cifar is not None and \
   'image_processor' in globals() and image_processor is not None:

    global trainer_vit # trainer_vit'i global yapalım
    trainer_vit = Trainer(
        model=model_vit,
        args=training_args_vit,
        train_dataset=processed_dataset_cifar["train"],
        eval_dataset=processed_dataset_cifar["validation"],
        tokenizer=image_processor, # ViT için tokenizer yerine image_processor
        compute_metrics=compute_metrics_image_clf,
        data_collator=default_data_collator,
    )
    print("\nTrainer objesi (ViT için) başarıyla oluşturuldu.")

    print("\nViT modeli eğitimi başlatılıyor...")
    print(f"Kullanılan cihaz: {device}. Epoch: {training_args_vit.num_train_epochs}, Train Batch: {training_args_vit.per_device_train_batch_size}")

    global training_time_vit # training_time_vit'i global yapalım
    start_time_vit_train = time.time()
    try:
        train_result_vit = trainer_vit.train()
        end_time_vit_train = time.time()
        training_time_vit = end_time_vit_train - start_time_vit_train

        print(f"\nEğitim tamamlandı! Toplam eğitim süresi: {training_time_vit:.2f} saniye ({training_time_vit/60:.2f} dakika).")

        if hasattr(train_result_vit, 'metrics') and train_result_vit.metrics:
            print("Genel eğitim sonuç metrikleri (trainer.train() dönüşünden):")
            for key, value in train_result_vit.metrics.items():
                print(f"  {key}: {value}")

        best_model_path_vit = f"{training_args_vit.output_dir}/best_model"
        trainer_vit.save_model(best_model_path_vit)
        image_processor.save_pretrained(best_model_path_vit)
        print(f"Eğitim sonrası (en iyi) ViT modeli ve image processor '{best_model_path_vit}' adresine kaydedildi.")

    except Exception as e:
        print(f"\nViT modeli eğitimi sırasında bir hata oluştu: {e}")
        import traceback
        print(traceback.format_exc())
        if 'train_result_vit' not in globals(): train_result_vit = None
        training_time_vit = None
else:
    print("\nModel, işlenmiş veri seti veya image processor bulunamadığı için Trainer oluşturulamadı ve eğitim başlatılamadı.")
    if 'trainer_vit' in globals(): del trainer_vit
    if 'train_result_vit' not in globals(): train_result_vit = None
    training_time_vit = None

### Hücre 7 (ViT): Eğitilmiş Modelin Test Seti Üzerinde Değerlendirilmesi

* **Amaç:**
    Hücre 6'da eğitimi tamamlanan ve en iyi checkpoint'i yüklenmiş olan Vision Transformer (ViT) modelinin, daha önce hiç görmediği CIFAR-10 test veri seti üzerindeki nihai sınıflandırma performansını ölçmek. Proje isterlerinde belirtilen tüm metrikleri (Accuracy, Precision Macro, Recall Macro, F1 Macro, Specificity Macro, AUC Macro) hesaplamak.

* **Yapılan İşlemler:**
    1.  Bir önceki hücrede eğitimi tamamlanmış ve en iyi modeli yüklemiş olan `trainer_vit` objesi kullanılır.
    2.  `trainer_vit.evaluate(eval_dataset=processed_dataset_cifar["test"])` metodu çağrılır. Bu metod:
        * Belirtilen `eval_dataset` (test setimiz) üzerinde modelin tahminlerini yapar.
        * Hücre 6'da tanımlanan `compute_metrics_image_clf` fonksiyonunu kullanarak tüm performans metriklerini hesaplar.
        * Hesaplanan metrikleri içeren bir sözlük (`vit_test_metrics`) döndürür.
    3.  Döndürülen metrikler ekrana okunaklı bir formatta yazdırılır.
    4.  Bu metrikler, daha sonraki analizler veya raporlama için `vit_test_metrics` adlı bir global değişkende saklanır.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * Test seti üzerinde değerlendirme yapılırken bir ilerleme çubuğu görülebilir.
    * Çıktıda, test seti için hesaplanan kayıp (Loss) ve diğer tüm performans metrikleri (Accuracy, Precision Macro, Recall Macro, F1 Macro, Specificity Macro, AUC Macro) listelenir.
    * Bu metrikler, modelin CIFAR-10 test verisi üzerindeki genelleme yeteneği hakkında nihai bir değerlendirme sunar.

In [None]:
# Hücre 7 (ViT): Eğitilmiş Modelin Test Seti Üzerinde Değerlendirilmesi

# Gerekli değişkenlerin (trainer_vit, processed_dataset_cifar)
# önceki hücrelerde doğru şekilde tanımlandığını varsayıyoruz.
if 'trainer_vit' in globals() and trainer_vit is not None and \
   'processed_dataset_cifar' in globals() and "test" in processed_dataset_cifar:

    print("Eğitilmiş ViT modeli test seti üzerinde değerlendiriliyor...")
    try:
        # trainer_vit.model zaten en iyi modeli içermeli (load_best_model_at_end=True sayesinde)
        test_metrics_vit_output = trainer_vit.evaluate(eval_dataset=processed_dataset_cifar["test"])

        print("\nViT Test Seti Performans Metrikleri:")
        # Trainer evaluate metodu, metrik isimlerinin başına 'eval_' ekler.
        print(f"  Test Kaybı (Loss): {test_metrics_vit_output.get('eval_loss', 'N/A'):.4f}")
        print(f"  Test Accuracy: {test_metrics_vit_output.get('eval_accuracy', 'N/A'):.4f}")
        print(f"  Test Precision (Macro): {test_metrics_vit_output.get('eval_precision_macro', 'N/A'):.4f}")
        print(f"  Test Recall (Macro): {test_metrics_vit_output.get('eval_recall_macro', 'N/A'):.4f}")
        print(f"  Test F1-Score (Macro): {test_metrics_vit_output.get('eval_f1_macro', 'N/A'):.4f}")
        print(f"  Test Specificity (Macro): {test_metrics_vit_output.get('eval_specificity_macro', 'N/A'):.4f}")
        print(f"  Test AUC (Macro): {test_metrics_vit_output.get('eval_auc_macro', 'N/A'):.4f}")

        # Metrikleri globalde saklayalım
        global vit_test_metrics
        vit_test_metrics = test_metrics_vit_output

    except Exception as e:
        print(f"\nViT Test seti değerlendirmesi sırasında bir hata oluştu: {e}")
        import traceback
        print(traceback.format_exc())
        if 'vit_test_metrics' not in globals(): vit_test_metrics = None
else:
    print("Hata: 'trainer_vit' objesi veya 'processed_dataset_cifar['test']' bulunamadı.")
    print("Lütfen önceki hücrelerin (özellikle Hücre 6 - ViT eğitimi) doğru çalıştığından emin olun.")
    if 'vit_test_metrics' not in globals(): vit_test_metrics = None

### Hücre 8 (ViT): Test Seti Sonuçlarının Görselleştirilmesi ve Eğitim Grafikleri

* **Amaç:**
    ViT modelinin test seti üzerindeki sınıflandırma performansını Karmaşıklık Matrisi ve ROC Eğrisi ile görsel olarak analiz etmek. Ayrıca, modelin eğitim süreci boyunca performansının nasıl değiştiğini (kayıp ve anahtar metrikler açısından) hem eğitim hem de doğrulama veri setleri üzerinde epoch bazında görselleştirmek.

* **Yapılan İşlemler (Görselleştirmeler):**
    1.  `trainer_vit.predict(processed_dataset_cifar["test"])` ile test seti üzerindeki ham tahminler (logitler) ve gerçek etiketler alınır.
    2.  Logitler olasılıklara dönüştürülür ve tahmin edilen etiketler belirlenir.
    3.  **Karmaşıklık Matrisi:** `sklearn.metrics.confusion_matrix` ile 10x10'luk karmaşıklık matrisi hesaplanır ve `seaborn.heatmap` ile görselleştirilir. `label_feature_cifar` kullanılarak eksen etiketleri sınıf isimleriyle (örn: "airplane", "cat") ayarlanır.
    4.  **ROC Eğrisi ve AUC (Çok Sınıflı Durum İçin):**
        * Her bir sınıf için One-vs-Rest (OvR) yaklaşımıyla ROC eğrileri çizdirilir veya daha genel bir bakış için makro-ortalama ROC eğrisi çizdirilir.
        * Test seti için `compute_metrics_image_clf` fonksiyonu zaten `auc_macro` değerini hesaplamıştır. Bu değer teyit edilir ve makro-ortalama ROC eğrisi grafiğine eklenir.
* **Yapılan İşlemler (Eğitim/Doğrulama Grafikleri):**
    1.  Hücre 6'daki eğitim sırasında `Trainer` tarafından kaydedilen `trainer_vit.state.log_history` alınır.
    2.  Bu loglar bir `pandas.DataFrame`'e dönüştürülür.
    3.  Eğitim logları ve doğrulama logları ayrılarak:
        * "Epoch Bazında Eğitim ve Doğrulama Kaybı" grafiği çizdirilir.
        * "Epoch Bazında Doğrulama Metrikleri (Accuracy & F1 Macro)" grafiği (veya ayrı ayrı) çizdirilir.
    4.  Grafiklerin başlıkları, eksen etiketleri ve lejantları eklenir.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * Test seti için 10x10 boyutunda bir Karmaşıklık Matrisi grafiği çizilir.
    * Makro-Ortalama ROC Eğrisi grafiği çizilir ve AUC değeri (Hücre 7'de hesaplananla tutarlı olmalı) gösterilir.
    * Eğitim ve doğrulama kayıplarının epoch'lar boyunca değişimini gösteren bir grafik elde edilir. Bu, aşırı öğrenme olup olmadığını ve modelin nasıl öğrendiğini gösterir.
    * Doğrulama doğruluğu ve F1 makro skorunun epoch'lar boyunca değişimini gösteren bir grafik elde edilir.

In [None]:
# Hücre 8 (ViT): Test Seti Sonuçlarının Görselleştirilmesi ve Eğitim Grafikleri

import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.metrics import confusion_matrix, roc_curve, RocCurveDisplay
from sklearn.metrics import auc as sklearn_auc
import numpy as np
import torch
import pandas as pd
from sklearn.preprocessing import label_binarize

# --- Test Seti Görselleştirmeleri ---
# Gerekli değişkenlerin (trainer_vit, processed_dataset_cifar, vit_test_metrics, label_feature_cifar)
# önceki hücrelerden doğru geldiğini varsayıyoruz.
if 'trainer_vit' in globals() and trainer_vit is not None and \
   'processed_dataset_cifar' in globals() and "test" in processed_dataset_cifar and \
   'vit_test_metrics' in globals() and vit_test_metrics is not None and \
   'label_feature_cifar' in globals() and label_feature_cifar is not None and hasattr(label_feature_cifar, 'names'):

    print("ViT Test seti üzerinde tahminler (logitler ve olasılıklar) alınıyor...")
    try:
        test_predictions_output_vit = trainer_vit.predict(processed_dataset_cifar["test"])

        logits_vit = test_predictions_output_vit.predictions
        probabilities_vit = torch.softmax(torch.tensor(logits_vit), dim=-1).cpu().numpy()
        predicted_labels_vit = np.argmax(logits_vit, axis=1)
        true_labels_vit = test_predictions_output_vit.label_ids

        num_classes_vit = label_feature_cifar.num_classes
        class_names_vit = label_feature_cifar.names

        # 1. Karmaşıklık Matrisi
        cm_vit = confusion_matrix(true_labels_vit, predicted_labels_vit, labels=list(range(num_classes_vit)))

        plt.figure(figsize=(10, 8))
        sns.heatmap(cm_vit, annot=True, fmt="d", cmap="Blues",
                    xticklabels=class_names_vit,
                    yticklabels=class_names_vit)
        plt.title('Karmaşıklık Matrisi (ViT - CIFAR-10 Test Seti)')
        plt.xlabel('Tahmin Edilen Etiket')
        plt.ylabel('Gerçek Etiket')
        plt.xticks(rotation=45, ha="right")
        plt.yticks(rotation=0)
        plt.tight_layout()
        plt.show()

        # 2. ROC Eğrisi ve AUC (Çok Sınıflı Durum - Macro Average)
        y_true_binarized_vit = label_binarize(true_labels_vit, classes=list(range(num_classes_vit)))

        fpr_vit = dict()
        tpr_vit = dict()
        roc_auc_vit = dict()

        for i in range(num_classes_vit):
            if y_true_binarized_vit.shape[1] > i : # Eğer binarize edilmiş etiketlerde o sınıf varsa
                fpr_vit[i], tpr_vit[i], _ = roc_curve(y_true_binarized_vit[:, i], probabilities_vit[:, i])
                roc_auc_vit[i] = sklearn_auc(fpr_vit[i], tpr_vit[i])
            else: # Nadir durum, eğer bir sınıf hiç yoksa veya binarizasyonda sorun olduysa
                fpr_vit[i], tpr_vit[i], roc_auc_vit[i] = np.array([0]), np.array([0]), 0.0


        all_fpr_vit = np.unique(np.concatenate([fpr_vit[i] for i in range(num_classes_vit) if i in fpr_vit]))
        mean_tpr_vit = np.zeros_like(all_fpr_vit)
        for i in range(num_classes_vit):
            if i in fpr_vit and i in tpr_vit: # Sadece geçerli olanları interpolasyon yap
                 mean_tpr_vit += np.interp(all_fpr_vit, fpr_vit[i], tpr_vit[i])
        mean_tpr_vit /= num_classes_vit # Sınıf sayısına böl
        roc_auc_macro_manual_vit = sklearn_auc(all_fpr_vit, mean_tpr_vit)

        plt.figure(figsize=(10, 8))
        plt.plot(all_fpr_vit, mean_tpr_vit,
                 label=f'Makro-Ortalama ROC eğrisi (AUC = {roc_auc_macro_manual_vit:.4f})',
                 color='deeppink', linestyle=':', linewidth=4)

        plt.plot([0, 1], [0, 1], 'k--', lw=2)
        plt.xlim([0.0, 1.0])
        plt.ylim([0.0, 1.05])
        plt.xlabel('Yanlış Pozitif Oranı (False Positive Rate)')
        plt.ylabel('Doğru Pozitif Oranı (True Positive Rate)')
        plt.title('ViT: Çok Sınıflı ROC Eğrisi (Makro Ortalama) - CIFAR-10 Test')
        plt.legend(loc="lower right")
        plt.grid(True)
        plt.show()

        print(f"\nHücre 7'de hesaplanan Test AUC (Macro) (trainer.evaluate): {vit_test_metrics.get('eval_auc_macro', 'N/A'):.4f}")
        print(f"Bu hücrede Makro-Ortalama ROC için hesaplanan AUC (sklearn): {roc_auc_macro_manual_vit:.4f}")

    except Exception as e_viz:
        print(f"\nViT Test seti görselleştirmeleri oluşturulurken bir hata oluştu: {e_viz}")
        import traceback
        print(traceback.format_exc())
else:
    print("Hata: ViT Test görselleştirmeleri için gerekli değişkenler bulunamadı.")

# --- Eğitim ve Doğrulama Log Grafikleri ---
if 'trainer_vit' in globals() and trainer_vit is not None and \
   hasattr(trainer_vit.state, 'log_history') and trainer_vit.state.log_history:

    log_history_vit = trainer_vit.state.log_history
    print("\nViT Eğitim Logları İşleniyor...")
    log_df_vit = pd.DataFrame(log_history_vit)

    train_logs_df_vit = log_df_vit[log_df_vit['loss'].notna() & log_df_vit['eval_loss'].isna()].copy()
    eval_logs_df_vit = log_df_vit[log_df_vit['eval_loss'].notna()].copy()

    if not train_logs_df_vit.empty and not eval_logs_df_vit.empty:
        # Kayıp Grafiği
        plt.figure(figsize=(12, 6))
        plt.plot(train_logs_df_vit['epoch'], train_logs_df_vit['loss'], 'b-o', label='Eğitim Kaybı')
        plt.plot(eval_logs_df_vit['epoch'], eval_logs_df_vit['eval_loss'], 'r-s', label='Doğrulama Kaybı')
        plt.title('ViT: Epoch Bazında Eğitim ve Doğrulama Kaybı')
        plt.xlabel('Epoch')
        plt.ylabel('Kayıp (Loss)')
        plt.legend()
        plt.grid(True)
        epochs_present_vit = sorted(list(set(eval_logs_df_vit['epoch'].round().tolist())))
        if epochs_present_vit:
            min_e_vit, max_e_vit = min(epochs_present_vit), max(epochs_present_vit)
            plt.xticks(np.arange(int(min_e_vit), int(max_e_vit) + 1, 1.0)) # Epochları tam sayı olarak göster
            plt.xlim(left=int(min_e_vit) - 0.5 if int(min_e_vit) > 0 else 0, right=int(max_e_vit) + 0.5)
        plt.show()

        # Doğruluk ve F1 Macro Grafiği
        fig, ax1_vit = plt.subplots(figsize=(12, 6))
        color = 'tab:green'
        ax1_vit.set_xlabel('Epoch')
        ax1_vit.set_ylabel('Doğruluk (Accuracy)', color=color)
        ax1_vit.plot(eval_logs_df_vit['epoch'], eval_logs_df_vit['eval_accuracy'], color=color, marker='^', linestyle='-', label='Doğrulama Doğruluğu')
        ax1_vit.tick_params(axis='y', labelcolor=color)

        ax2_vit = ax1_vit.twinx()
        color = 'tab:purple'
        ax2_vit.set_ylabel('F1 Skoru (Macro)', color=color)
        ax2_vit.plot(eval_logs_df_vit['epoch'], eval_logs_df_vit['eval_f1_macro'], color=color, marker='x', linestyle='--', label='Doğrulama F1 (Macro)')
        ax2_vit.tick_params(axis='y', labelcolor=color)

        plt.title('ViT: Epoch Bazında Doğrulama Metrikleri')
        fig.tight_layout()
        lines, labels_ax1 = ax1_vit.get_legend_handles_labels()
        lines2, labels_ax2 = ax2_vit.get_legend_handles_labels()
        ax2_vit.legend(lines + lines2, labels_ax1 + labels_ax2, loc='best')
        if epochs_present_vit:
            plt.xticks(np.arange(int(min_e_vit), int(max_e_vit) + 1, 1.0))
            ax1_vit.set_xlim(left=int(min_e_vit) - 0.5 if int(min_e_vit) > 0 else 0, right=int(max_e_vit) + 0.5)
        plt.grid(True, axis='x')
        ax1_vit.grid(True, axis='y', linestyle=':', alpha=0.7)
        plt.show()
    else:
        print("ViT Grafiklerini çizdirmek için yeterli eğitim veya doğrulama logu bulunamadı.")
else:
    print("Hata: ViT Log Grafikleri için 'trainer_vit' objesi veya 'log_history' bulunamadı.")

### Hücre 9 (ViT): Eğitim ve Çıkarım Sürelerinin Hesaplanması

* **Amaç:**
    Vision Transformer (ViT) modelinin hem eğitim (fine-tuning) süresini hem de eğitilmiş modelle yeni görüntüler üzerinde tahmin yapma (çıkarım/inference) hızını belirlemek.

* **Yapılan İşlemler:**
    1.  **Eğitim Süresi:** Hücre 6'da model eğitimi sırasında ölçülen ve `training_time_vit` değişkeninde saklanan toplam eğitim süresi saniye ve dakika cinsinden yazdırılır.
    2.  **Örnek Başına Ortalama Çıkarım Süresi:**
        * `trainer_vit.model` (en iyi checkpoint yüklendiği varsayılır) değerlendirme moduna (`model_vit.eval()`) alınır.
        * Ön işlenmiş (dönüşümleri atanmış) test seti (`processed_dataset_cifar["test"]`) kullanılır.
        * `torch.utils.data.DataLoader` ile test verileri yığınlar (batch) halinde hazırlanır. `default_data_collator` kullanılır.
        * `torch.no_grad()` bloğu içinde, her bir yığın için modelden tahminler (`pixel_values` ile) alınır ve yığının işlenme süresi ölçülür.
        * Toplam çıkarım süresi ve işlenen toplam görüntü sayısı kullanılarak görüntü başına ortalama çıkarım süresi ve saniyede işlenen görüntü sayısı hesaplanıp yazdırılır.

* **Uygulama Detayları/Sonuçlar (Beklenen):**
    * Toplam eğitim süresi yazdırılır.
    * Test seti üzerinde çıkarım yapılırken ilerleme çubuğu gösterilir.
    * Çıkarım tamamlandığında, toplam çıkarım süresi, görüntü başına ortalama çıkarım süresi ve saniyede işlenen görüntü sayısı ekrana yazdırılır.

In [None]:
# Hücre 9 (ViT): Eğitim ve Çıkarım Sürelerinin Hesaplanması

# time, torch, tqdm.auto, DataLoader zaten import edilmiş olmalı.
from tqdm.auto import tqdm
from torch.utils.data import DataLoader
from transformers import default_data_collator # Trainer'ın kullandığı collator

# 1. Eğitim Süresi
if 'training_time_vit' in globals() and training_time_vit is not None:
    print(f"Toplam ViT Model Eğitim Süresi: {training_time_vit:.2f} saniye ({training_time_vit/60:.2f} dakika)")
else:
    # Eğer training_time_vit tanımlanmadıysa, trainer_vit.state.log_history'den almayı deneyelim
    if 'trainer_vit' in globals() and hasattr(trainer_vit.state, 'log_history') and trainer_vit.state.log_history:
        train_log_final_entry = next((item for item in reversed(trainer_vit.state.log_history) if "train_runtime" in item), None)
        if train_log_final_entry:
            calculated_training_time_vit = train_log_final_entry['train_runtime']
            print(f"Toplam ViT Model Eğitim Süresi (logdan alındı): {calculated_training_time_vit:.2f} saniye ({calculated_training_time_vit/60:.2f} dakika)")
            training_time_vit = calculated_training_time_vit # Değişkeni güncelleyelim
        else:
            print("ViT eğitim süresi bilgisi `training_time_vit` değişkeninden veya `log_history`'den alınamadı.")
    else:
        print("ViT eğitim süresi bilgisi `training_time_vit` değişkeninden veya `log_history`'den alınamadı.")


# 2. Örnek Başına Ortalama Çıkarım Süresi (Test Seti Üzerinden)
avg_inference_time_per_image_vit = None
# Gerekli değişkenlerin varlığını kontrol edelim
if 'model_vit' in globals() and model_vit is not None and \
   'processed_dataset_cifar' in globals() and "test" in processed_dataset_cifar and \
   'device' in globals() :

    model_vit.eval()

    # processed_dataset_cifar["test"] zaten .with_transform(preprocess_eval) ile ayarlanmıştı.
    # Bu transform, 'pixel_values' ve 'labels' içeren dict'ler döndürür.
    # DataLoader için data_collator kullanalım.
    inference_batch_size_vit = training_args_vit.per_device_eval_batch_size if 'training_args_vit' in globals() else 64

    # DataLoader'a doğrudan dönüştürülmüş veri setini verelim
    # Not: processed_dataset_cifar["test"] içindeki örnekler zaten tensör formatında olmalı
    # çünkü preprocess_eval 'pixel_values' ve 'labels' tensörleri döndürüyor.
    # Eğer DataLoader hata verirse, .with_transform(None) ile ham veriyi alıp kendimiz collate edebiliriz.
    # Ancak default_data_collator genellikle işe yarar.

    # Test için kullanılacak dataset (transform uygulanmış haliyle)
    eval_ds_for_inference = processed_dataset_cifar["test"]

    # Trainer'ın kullandığı gibi bir DataLoader oluşturalım
    # default_data_collator, list of dicts (her biri 'pixel_values', 'labels' içerir) alıp
    # bunları bir batch dict'ine ({'pixel_values': batched_pixels, 'labels': batched_labels}) dönüştürür.
    inference_dataloader_vit = DataLoader(
        eval_ds_for_inference,
        batch_size=inference_batch_size_vit,
        collate_fn=default_data_collator
    )

    total_inference_time_val_vit = 0.0
    num_images_processed = 0

    print(f"\nViT Test seti üzerinde çıkarım süresi hesaplanıyor (Batch Size: {inference_batch_size_vit})...")

    with torch.no_grad():
        for batch in tqdm(inference_dataloader_vit, desc="ViT Çıkarım"):
            # default_data_collator 'labels'ı da getirecektir, çıkarım için gerekmese de sorun değil.
            # Sadece 'pixel_values'ı modele verelim.
            pixel_values = batch.get('pixel_values').to(device)

            if pixel_values is None:
                print("Uyarı: Batch'te 'pixel_values' bulunamadı, bu yığın atlanıyor.")
                num_images_processed += batch.get('labels').size(0) if 'labels' in batch else inference_batch_size_vit
                continue

            start_batch_time = time.perf_counter()
            outputs = model_vit(pixel_values=pixel_values) # Sadece pixel_values ile çağır
            end_batch_time = time.perf_counter()

            batch_time = end_batch_time - start_batch_time
            total_inference_time_val_vit += batch_time
            num_images_processed += pixel_values.size(0)

    if num_images_processed > 0 and total_inference_time_val_vit > 0 :
        avg_inference_time_per_image_vit = total_inference_time_val_vit / num_images_processed
        images_per_second_inference_vit = num_images_processed / total_inference_time_val_vit
        print(f"\nToplam {num_images_processed} görüntü için ViT çıkarım süresi: {total_inference_time_val_vit:.4f} saniye")
        print(f"Görüntü başına ortalama ViT çıkarım süresi: {avg_inference_time_per_image_vit:.6f} saniye/görüntü")
        print(f"Saniyede işlenen ViT görüntü sayısı (çıkarım): {images_per_second_inference_vit:.2f} görüntü/saniye")
    elif num_images_processed > 0 and total_inference_time_val_vit == 0 :
        print(f"\nToplam {num_images_processed} görüntü için ViT çıkarım süresi çok kısa, hız çok yüksek.")
        avg_inference_time_per_image_vit = 0.0
    else:
        print("ViT Çıkarım için hiç görüntü işlenemedi veya süre ölçülemedi.")

else:
    print("Hata: ViT Modeli, işlenmiş test seti veya cihaz bilgisi bulunamadı.")