# Müzik Türü Sınıflandırma Projesi

Bu notebook, FMA (Free Music Archive) veri setini kullanarak müzik türü sınıflandırma modeli geliştirmek için veri hazırlama ve dengeleme işlemlerini içermektedir.

## Gerekli Kütüphanelerin İçe Aktarılması
Aşağıdaki hücrede, projede kullanılacak temel Python kütüphaneleri import edilmektedir:

In [None]:
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.feature_selection import SelectKBest, f_classif
from imblearn.over_sampling import RandomOverSampler, BorderlineSMOTE
from collections import Counter

%matplotlib inline
sns.set(style='whitegrid')

## Yardımcı Fonksiyonlar

### Sınıf Dağılımı Görselleştirme Fonksiyonu
Aşağıdaki fonksiyon, veri setindeki sınıf dağılımlarını görselleştirmek için kullanılacaktır. Bu görselleştirme, veri dengesizliğini anlamamıza yardımcı olur.

In [None]:
def plot_class_distribution(y, labels, title):
    counts = pd.Series(y).value_counts().sort_index()
    valid_indices = counts.index[counts.index < len(labels)]
    counts = counts.loc[valid_indices]
    names = labels[counts.index]

    plt.figure(figsize=(12, 6))
    ax = sns.barplot(x=names, y=counts.values, hue=names, palette='viridis', legend=False)
    ax.set_title(title)
    ax.set_xlabel('Sınıf')
    ax.set_ylabel('Sayı')
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()

## Veri Yükleme ve Ön İşleme

Bu bölümdeki fonksiyon:
- FMA metadata dosyalarını yükler
- Gerekli sütunları seçer
- Eksik verileri temizler
- Etiketleri kodlar
- Veriyi sayısal formata dönüştürür

In [None]:
def load_data():
    tracks_path = 'fma_metadata/tracks.csv'
    features_path = 'fma_metadata/features.csv'

    if not os.path.exists(tracks_path) or not os.path.exists(features_path):
        raise FileNotFoundError(f"Gerekli veri dosyaları bulunamadı. '{tracks_path}' ve '{features_path}' dosyalarının mevcut olduğundan emin olun.")

    tracks = pd.read_csv(tracks_path, index_col=0, header=[0,1])
    features = pd.read_csv(features_path, index_col=0, header=[0,1])  # Çok seviyeli başlıkla oku
    
    print("Kullanılabilir özellik kategorileri:", features.columns.get_level_values(0).unique())
    print(f"Toplam özellik sayısı (ham): {features.shape[1]}")
    
    # İlk olarak statistics sütunlarını çıkar (non-audio features)
    print("\n--- İstatistik sütunları çıkarılıyor ---")
    non_statistics_features = features.loc[:, features.columns.get_level_values(0) != 'statistics']
    print(f"Statistics çıkarıldıktan sonra: {non_statistics_features.shape[1]} özellik")
    
    # Şimdi tüm audio feature kategorilerini analiz et
    feature_categories = non_statistics_features.columns.get_level_values(0).unique()
    print(f"Audio özellik kategorileri: {list(feature_categories)}")
    
    # Her kategorideki özellik sayısını göster
    category_counts = {}
    for category in feature_categories:
        count = len([col for col in non_statistics_features.columns if col[0] == category])
        category_counts[category] = count
        print(f"- {category}: {count} özellik")
    
    # Tüm audio özelliklerini kullan (statistics hariç)
    selected_features = non_statistics_features
    
    # Özellik türlerini kategorize et (daha sonra balanced selection için)
    feature_counts = {'mfcc': 0, 'chroma': 0, 'spectral': 0, 'other': 0}
    
    # MFCC özellikleri
    mfcc_cols = [col for col in selected_features.columns if 'mfcc' in col[0].lower()]
    feature_counts['mfcc'] = len(mfcc_cols)
    
    # Chroma özellikleri  
    chroma_cols = [col for col in selected_features.columns if 'chroma' in col[0].lower()]
    feature_counts['chroma'] = len(chroma_cols)
    
    # Spectral özellikleri
    spectral_keywords = ['spectral', 'centroid', 'bandwidth', 'contrast', 'rolloff']
    spectral_cols = [col for col in selected_features.columns 
                    if any(keyword in col[0].lower() for keyword in spectral_keywords)]
    feature_counts['spectral'] = len(spectral_cols)
    
    # Diğer audio özellikleri (MFCC, Chroma, Spectral olmayan)
    other_cols = [col for col in selected_features.columns 
                 if col not in mfcc_cols and col not in chroma_cols and col not in spectral_cols]
    feature_counts['other'] = len(other_cols)
    
    print(f"\n--- Özellik Kategorilerine Göre Dağılım ---")
    print(f"- MFCC: {feature_counts['mfcc']} özellik")
    print(f"- Chroma: {feature_counts['chroma']} özellik")
    print(f"- Spectral: {feature_counts['spectral']} özellik")
    print(f"- Diğer Audio: {feature_counts['other']} özellik")
    print(f"- TOPLAM: {sum(feature_counts.values())} özellik")
    
    # Özellik türü listelerini global değişken olarak sakla (feature selection'da kullanmak için)
    global mfcc_column_names, chroma_column_names, spectral_column_names, other_column_names
    mfcc_column_names = mfcc_cols
    chroma_column_names = chroma_cols
    spectral_column_names = spectral_cols
    other_column_names = other_cols
    
    # Tüm özellikleri kullan
    features = selected_features
    print(f"\n✅ TÜM audio özellikleri kullanılacak: {features.shape[1]} özellik")
    
    # Sayısal formata dönüştür
    features = features.astype(np.float32)
    features.index = features.index.astype(str)
    tracks.index = tracks.index.astype(str)

    genre_series = tracks[('track', 'genre_top')].dropna()
    common_index = features.index.intersection(genre_series.index)

    X = features.loc[common_index]
    y_labels = genre_series.loc[common_index]

    X = X.fillna(0).replace([np.inf, -np.inf], 0).astype(np.float32)

    label_encoder = LabelEncoder()
    y = label_encoder.fit_transform(y_labels)

    print(f'\n=== SONUÇ ===')    
    print(f'- Toplam özellik sayısı: {X.shape[1]} (Önceki 518 ile karşılaştır!)')
    print(f'- Örneklem sayısı: {X.shape[0]}')
    print(f'- Sınıf sayısı: {len(label_encoder.classes_)}')
    print(f'- MFCC: {feature_counts["mfcc"]} özellik')
    print(f'- Chroma: {feature_counts["chroma"]} özellik') 
    print(f'- Spectral: {feature_counts["spectral"]} özellik')
    print(f'- Diğer Audio: {feature_counts["other"]} özellik')
    print(f'- Tam zaman serisi için TÜM audio özellikler dahil edildi')
    
    return X, y, label_encoder

## Başlangıç Veri Analizi

Verinin ilk yüklemesini yapıp, başlangıçtaki sınıf dağılımını inceleyelim. Bu analiz, veri dengesizliği problemini görselleştirmemize yardımcı olacak.

In [None]:
# Veriyi yükle ve önişle
X, y, le = load_data()

# Başlangıç dağılımını göster
plot_class_distribution(y, le.classes_, 'Başlangıç Sınıf Dağılımı')

## Veri Bölme ve Eğitim Seti Analizi

Veriyi eğitim ve test setlerine ayırıp, eğitim setindeki sınıf dağılımını inceliyoruz. Stratified split kullanarak orijinal dağılımı koruyoruz.

In [None]:
# Veriyi böl ve eğitim dağılımını göster
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, stratify=y, random_state=42
)

plot_class_distribution(y_train, le.classes_, 'Eğitim Seti Dağılımı')
print(f'Eğitim/test bölünmesi tamamlandı: X_train {X_train.shape}, X_test {X_test.shape}')

# Detaylı dağılımı yazdır
unique, counts = np.unique(y_train, return_counts=True)
print("\nEğitim Seti Dağılımı (ham sayılar):")
for i, (u, c) in enumerate(zip(unique, counts)):
    print(f"Sınıf {u} ({le.classes_[i]}): {c} örnek")

## Veri Dengeleme - Aşama 1

İlk aşamada, çok az örneğe sahip sınıflar için RandomOverSampler kullanılıyor. Bu aşama, BorderlineSMOTE için yeterli örnek sayısına ulaşmamızı sağlar.

In [None]:
# Adım 1: En az temsil edilen sınıflar için RandomOverSampler
print('\nAdım 1: Aşırı az temsil edilen sınıflar için RandomOverSampler uygulanıyor...')
min_samples_threshold = 60  # BorderlineSMOTE için gereken minimum örnek sayısı
ros = RandomOverSampler(sampling_strategy={3: min_samples_threshold}, random_state=42)
X_partial, y_partial = ros.fit_resample(X_train, y_train)

# Ara sonuçları göster
unique_partial, counts_partial = np.unique(y_partial, return_counts=True)
print("\nRandomOverSampler sonrası dağılım (ham sayılar):")
for i, (u, c) in enumerate(zip(unique_partial, counts_partial)):
    print(f"Sınıf {u} ({le.classes_[i]}): {c} örnek")

plot_class_distribution(y_partial, le.classes_, 'RandomOverSampler Sonrası')

## Veri Dengeleme - Aşama 2

İkinci aşamada, daha sofistike bir yaklaşım olan BorderlineSMOTE kullanılarak kalan sınıflar dengeleniyor. Bu yöntem, sadece rastgele kopyalama yerine sentetik örnekler oluşturur.

Not: Bu aşama, veri setinin yapısına bağlı olarak başarısız olabilir. Bu durumda, ilk aşamadaki sonuçlar kullanılacaktır.

In [None]:
# Adım 2: Kalan sınıflar için BorderlineSMOTE
print('\nAdım 2: Kalan sınıflar için BorderlineSMOTE uygulanıyor...')
borderline_smote = BorderlineSMOTE(random_state=42)

try:
    X_res, y_res = borderline_smote.fit_resample(X_partial, y_partial)
    print(f'Kombine örnekleme tamamlandı: X_res {X_res.shape}, y_res {y_res.shape}')
    
    # Son dağılımı yazdır ve göster
    unique_res, counts_res = np.unique(y_res, return_counts=True)
    print("\nSon Dağılım (ham sayılar):")
    for i, (u, c) in enumerate(zip(unique_res, counts_res)):
        print(f"Sınıf {u} ({le.classes_[i]}): {c} örnek")
    
    plot_class_distribution(y_res, le.classes_, 'Son Dengelenmiş Dağılım')

except Exception as e:
    print(f'BorderlineSMOTE örnekleme başarısız oldu: {e} - kısmi örneklenmiş veri kullanılıyor')
    X_res, y_res = X_partial, y_partial
    plot_class_distribution(y_res, le.classes_, 'Kısmi Örnekleme (BorderlineSMOTE başarısız)')
    
print("\nİşlem hattı tamamlandı. Yeniden örneklenmiş eğitim verisi (X_res, y_res) ve test verisi (X_test, y_test) hazır.")


## Gelişmiş Özellik Seçimi (LSTM İçin Optimize)

Model performansını artırmak ve LSTM için optimize edilmiş özellik seçimi uygulayacağız. Mutual Information ile temporal dependencies yakalarken, correlation filtering ile multicollinearity'yi azaltacağız.

In [None]:
# Gelişmiş Özellik Seçimi - LSTM için Optimize
from sklearn.feature_selection import mutual_info_classif, RFE, SelectKBest, f_classif
from sklearn.ensemble import RandomForestClassifier
import warnings
warnings.filterwarnings('ignore')

print('\nLSTM için optimize edilmiş gelişmiş özellik seçimi uygulanıyor...')

# Toplam seçilecek özellik sayısı
total_k = 160  # 4 kategoriye bölünecek (MFCC, Chroma, Spectral, Others)
k_per_category = total_k // 4  # Her kategori için eşit sayıda özellik

print(f"Toplam özellik sayısı: {X_res.shape[1]}, Seçilecek özellik sayısı: {total_k}")
print(f"Her özellik kategorisinden seçilecek: {k_per_category}")

# Özellik isimlerini oluştur
if hasattr(X_res, 'columns'):
    if isinstance(X_res.columns, pd.MultiIndex):
        feature_names = [f"{col[0]}_{col[1]}" if len(col) > 1 else str(col[0]) for col in X_res.columns]
    else:
        feature_names = [str(col) for col in X_res.columns]
else:
    feature_names = [f'feature_{i}' for i in range(X_res.shape[1])]

print(f"Özellik isimleri oluşturuldu: {len(feature_names)} adet")

# X_res'i numpy array'e dönüştür
X_res_array = X_res.values
X_test_array = X_test.values

# Hızlı ve Optimize Edilmiş Özellik Seçimi (LSTM için)
print("\n⚡ Hızlı ve Optimize Edilmiş özellik seçimi uygulanıyor...")
print("   ✅ SelectKBest + Basit korelasyon filtreleme")
print("   ✅ Çok daha hızlı ve etkili")
print("   ✅ LSTM için yeterince iyi performans")

# Özellik kategorilerini bul
mfcc_indices = [i for i, name in enumerate(feature_names) if 'mfcc' in name.lower()]
chroma_indices = [i for i, name in enumerate(feature_names) if 'chroma' in name.lower()]
spectral_indices = [i for i, name in enumerate(feature_names) if any(spec in name.lower() for spec in ['spectral', 'centroid', 'bandwidth', 'contrast', 'rolloff'])]
other_indices = [i for i in range(len(feature_names)) 
                if i not in mfcc_indices and i not in chroma_indices and i not in spectral_indices]

print(f"\nÖzellik kategori sayıları:")
print(f"- MFCC: {len(mfcc_indices)} özellik")
print(f"- Chroma: {len(chroma_indices)} özellik")
print(f"- Spectral: {len(spectral_indices)} özellik")
print(f"- Diğer: {len(other_indices)} özellik")

# 1. Adım: Her kategoriden SelectKBest ile hızlı seçim
selected_indices = []
category_info = []

for category_name, indices in [('MFCC', mfcc_indices), ('Chroma', chroma_indices), 
                              ('Spectral', spectral_indices), ('Others', other_indices)]:
    if len(indices) > 0:
        X_category = X_res_array[:, indices]
        
        # SelectKBest ile hızlı seçim (F-test)
        k_category = min(k_per_category, len(indices))
        selector = SelectKBest(score_func=f_classif, k=k_category)
        selector.fit(X_category, y_res)
        
        # Seçilen özelliklerin orijinal indekslerini al
        selected_mask = selector.get_support()
        selected_category_indices = [indices[i] for i in range(len(indices)) if selected_mask[i]]
        selected_indices.extend(selected_category_indices)
        
        category_info.append({
            'name': category_name,
            'total': len(indices),
            'selected': len(selected_category_indices),
            'avg_score': np.mean(selector.scores_[selected_mask])
        })
        
        print(f"   {category_name}: {len(selected_category_indices)} özellik seçildi, Ortalama F-score: {np.mean(selector.scores_[selected_mask]):.2f}")

# 2. Adım: Basit korelasyon filtreleme (çok daha hızlı)
print(f"\n🔍 Basit korelasyon filtreleme uygulanıyor...")
final_indices = selected_indices.copy()

if len(final_indices) > 50:  # Sadece çok fazla özellik varsa korelasyon filtrele
    print("   Korelasyon matrisi hesaplanıyor...")
    corr_matrix = np.corrcoef(X_res_array[:, final_indices].T)
    
    # Basit korelasyon filtreleme (ilk bulduğunu çıkar)
    to_remove = set()
    for i in range(len(corr_matrix)):
        if i in to_remove:
            continue
        for j in range(i+1, len(corr_matrix)):
            if j not in to_remove and abs(corr_matrix[i, j]) > 0.95:  # Çok yüksek korelasyon
                to_remove.add(j)  # j'yi çıkar (basit kural)
                if len(to_remove) > 10:  # Maksimum 10 özellik çıkar
                    break
        if len(to_remove) > 10:
            break
    
    # Çıkarılacak indeksleri kaldır
    final_indices = [final_indices[i] for i in range(len(final_indices)) if i not in to_remove]
    
    print(f"   {len(to_remove)} yüksek korelasyonlu özellik çıkarıldı")
    print(f"   Final özellik sayısı: {len(final_indices)}")
else:
    print("   Özellik sayısı az, korelasyon filtreleme atlanıyor")

hybrid_indices = final_indices

# Seçilen özellikleri uygula
X_res_selected = X_res_array[:, hybrid_indices]
X_test_selected = X_test_array[:, hybrid_indices]
selected_feature_names = [feature_names[i] for i in hybrid_indices]

print(f"\n✅ Hızlı Özellik Seçimi tamamlandı!")
print(f"📊 Final özellik sayısı: {len(hybrid_indices)}")
print(f"📋 Seçilen özelliklerin boyutu: {X_res_selected.shape}")

# Final kategori dağılımını kontrol et
final_mfcc = len([name for name in selected_feature_names if 'mfcc' in name.lower()])
final_chroma = len([name for name in selected_feature_names if 'chroma' in name.lower()])
final_spectral = len([name for name in selected_feature_names if any(spec in name.lower() for spec in ['spectral', 'centroid', 'bandwidth', 'contrast', 'rolloff'])])
final_others = len(selected_feature_names) - final_mfcc - final_chroma - final_spectral

print(f"\n📈 Final Kategori Dağılımı:")
print(f"   - MFCC: {final_mfcc} özellik")
print(f"   - Chroma: {final_chroma} özellik")
print(f"   - Spectral: {final_spectral} özellik")
print(f"   - Others: {final_others} özellik")

# Global değişkenleri güncelle
X_res = X_res_selected
X_test = X_test_selected
feature_names = selected_feature_names

print(f"\n🎯 Hızlı özellik seçimi tamamlandı!")
print(f"⚡ Veri şekli güncellendi: X_res {X_res.shape}, X_test {X_test.shape}")
print(f"✨ SelectKBest + Basit korelasyon filtreleme kullanıldı!")

## Özellik Seçimi Doğrulaması

Seçilen özelliklerin doğru bir şekilde MFCC, Chroma ve Spectral kategorilerinden dengeli olarak seçilip seçilmediğini ve Hybrid MI + Correlation Filter yönteminin etkinliğini kontrol edelim.

In [None]:
# Seçilen özelliklerin doğrulaması
print("\n=== ÖZELLİK SEÇİMİ DOĞRULAMASI ===")

# Seçilen özelliklerin kategorilere göre dağılımını kontrol et
mfcc_selected = len([name for name in feature_names if 'mfcc' in name.lower()])
chroma_selected = len([name for name in feature_names if 'chroma' in name.lower()])
spectral_selected = len([name for name in feature_names if any(spec in name.lower() for spec in ['spectral', 'centroid', 'bandwidth', 'contrast', 'rolloff'])])
others_selected = len(feature_names) - mfcc_selected - chroma_selected - spectral_selected

print(f"Seçilen özellik dağılımı:")
print(f"- MFCC: {mfcc_selected} özellik")
print(f"- Chroma: {chroma_selected} özellik")
print(f"- Spectral: {spectral_selected} özellik")
print(f"- Diğer Audio: {others_selected} özellik")
print(f"- Toplam: {len(feature_names)} özellik")

# Dengelilik kontrolü
expected_per_category = total_k // 4
balance_check = (
    abs(mfcc_selected - expected_per_category) <= 5 and 
    abs(chroma_selected - expected_per_category) <= 5 and 
    abs(spectral_selected - expected_per_category) <= 5 and
    abs(others_selected - expected_per_category) <= 5
)

if balance_check:
    print("\n✅ Başarılı! Özellik seçimi dengeli olarak yapıldı.")
else:
    print("\n⚠️ Uyarı: Özellik seçimi tam dengeli değil, ancak hızlı ve etkili bir şekilde uygulandı.")

# Hızlı özellik seçimi analizi
print(f"\n🎵 Hızlı Audio Feature Selection:")
print(f"- MFCC özellikleri: SelectKBest ile seçilmiş mel-frequency coefficients")
print(f"- Chroma özellikleri: SelectKBest ile seçilmiş harmonic content")
print(f"- Spectral özellikleri: SelectKBest ile seçilmiş spectral characteristics")
print(f"- Others: Diğer önemli audio features")

# Örnek seçilen özellik isimlerini göster
print("\nÖrnek seçilen özellik isimleri (ilk 10):")
for i, name in enumerate(feature_names[:10]):
    print(f"{i+1:2d}. {name}")

print(f"\nSon veri şekli: X_res {X_res.shape}, X_test {X_test.shape}")
print("Artık hızlı ve etkili özellik seçimi ile LSTM modeli eğitmeye hazırız!")
print("\n✨ SelectKBest + basit korelasyon filtreleme uygulandı!")

*-----------------------------------------------------------------------------------*
# PyTorch LSTM MODEL EĞİTİMİ
*-----------------------------------------------------------------------------------*

In [None]:
print("\nPyTorch LSTM Model Eğitimi Başlıyor...")

# Veri yükleme, önişleme, bölme ve dengeleme adımlarının tamamlandığı varsayılır.
# Bu noktada aşağıdaki değişkenlerin mevcut olması beklenir:
# X_res, y_res (Dengelenmiş eğitim verisi)
# X_val, y_val (Doğrulama verisi)
# X_test, y_test (Test verisi)
# le (LabelEncoder nesnesi)

In [None]:
# Dengelenmiş veri setinden doğrulama seti ayır
X_train_bal, X_val, y_train_bal, y_val = train_test_split(
    X_res, y_res, test_size=0.1, stratify=y_res, random_state=42
)

# Veri Ölçeklendirme (StandardScaler)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train_bal)
X_val_scaled = scaler.transform(X_val)
X_test_scaled = scaler.transform(X_test)

print("Veri ölçeklendirme tamamlandı.")
print(f"Ölçeklenmiş eğitim verisi boyutu: {X_train_scaled.shape}")
print(f"Ölçeklenmiş doğrulama verisi boyutu: {X_val_scaled.shape}")
print(f"Ölçeklenmiş test verisi boyutu: {X_test_scaled.shape}")

## LSTM Modeli için Veri Hazırlığı

PyTorch LSTM modeli için, veriyi uygun formata dönüştürmemiz gerekir. LSTM modeller sıralı veri bekler.

**Önemli**: FMA özellikleri gerçekte temporal (zamansal) yapıya sahiptir:
- **MFCC**: Zamansal pencerelerden çıkarılan mel-frekans katsayıları
- **Chroma**: Zaman içinde değişen ton özellikleri
- **Spectral**: Zamansal spektral karakteristikler

Bu nedenle, yapay sıralama yerine **gerçek temporal yapıyı koruyan** bir yaklaşım kullanıyoruz:
- Her özellik kategorisi ayrı bir zaman adımı olur
- Gerçek audio feature temporal ilişkileri korunur
- LSTM gerçek müzik temporal pattern'larını öğrenebilir

### Alternatif Yaklaşımlar ve Seçenekler

**1. Grouped Approach (Mevcut)**: Her özellik türünü ayrı timestep olarak kullanır
- Avantaj: Gerçek audio feature kategorilerini korur
- Dezavantaj: Kategori içi temporal sırayı tam koruyamaz

**2. Feature Type Separated**: Her özellik türünü ayrı kanal olarak işler
- Avantaj: Temporal yapıyı bozmadan özellik türlerini korur
- LSTM için optimize edilmiş yaklaşım

**3. Transformer Yaklaşım**: Attention mekanizması ile
- Avantaj: Uzun mesafe bağımlılıkları yakalar
- Modern ve etkili (LSTM alternatifi)

**4. Standard MLP**: Sequential structure'u yok say
- Avantaj: Basit ve hızlı
- Dezavantaj: Temporal bilgiyi kaybeder

In [None]:
# PyTorch tensörlerine dönüştürme ve veri setlerini hazırlama
def create_temporal_sequence_data(X, y, feature_names, sequence_approach='grouped'):
    """
    Gerçek temporal özellik yapısını koruyarak sıralı veri oluşturur.
    
    Args:
        X: Özellik matrisi
        y: Etiketler
        feature_names: Özellik isimleri
        sequence_approach: 'grouped' veya 'individual'
    """
    n_samples, n_features = X.shape
    
    if sequence_approach == 'grouped':
        # Yaklaşım 1: Her özellik türünü ayrı timestep olarak kullan
        # MFCC -> timestep 1, Chroma -> timestep 2, Spectral -> timestep 3, Others -> timestep 4
        
        # Özellik kategorilerini ayır
        mfcc_indices = [i for i, name in enumerate(feature_names) if 'mfcc' in name.lower()]
        chroma_indices = [i for i, name in enumerate(feature_names) if 'chroma' in name.lower()]
        spectral_indices = [i for i, name in enumerate(feature_names) if any(spec in name.lower() for spec in ['spectral', 'centroid', 'bandwidth', 'contrast', 'rolloff'])]
        other_indices = [i for i in range(len(feature_names)) 
                        if i not in mfcc_indices and i not in chroma_indices and i not in spectral_indices]
        
        # Her kategoriyi ayrı timestep olarak düzenle
        categories = [mfcc_indices, chroma_indices, spectral_indices, other_indices]
        category_names = ['MFCC', 'Chroma', 'Spectral', 'Others']
        
        # En büyük kategori boyutunu bul (padding için)
        max_features_per_category = max(len(cat) for cat in categories if len(cat) > 0)
        sequence_length = len([cat for cat in categories if len(cat) > 0])  # Boş olmayan kategori sayısı
        
        print(f"Temporal organizasyon:")
        for i, (cat, name) in enumerate(zip(categories, category_names)):
            if len(cat) > 0:
                print(f"  Timestep {i+1}: {name} - {len(cat)} özellik")
        
        # Sequence tensor oluştur
        X_seq = np.zeros((n_samples, sequence_length, max_features_per_category))
        
        timestep = 0
        for cat_indices in categories:
            if len(cat_indices) > 0:
                # Bu kategorinin özelliklerini al
                cat_features = X[:, cat_indices]
                # Padding ile aynı boyuta getir
                X_seq[:, timestep, :len(cat_indices)] = cat_features
                timestep += 1
        
        print(f"Final sequence shape: {X_seq.shape}")
        print(f"(samples, timesteps, features_per_timestep)")
        
    elif sequence_approach == 'individual':
        # Yaklaşım 2: Her özelliği ayrı timestep olarak kullan (çok uzun olabilir)
        sequence_length = min(n_features, 50)  # Maksimum 50 timestep
        features_per_timestep = 1
        
        X_seq = np.zeros((n_samples, sequence_length, features_per_timestep))
        
        for i in range(n_samples):
            for t in range(sequence_length):
                X_seq[i, t, 0] = X[i, t]
        
        print(f"Individual feature sequence shape: {X_seq.shape}")
    
    else:
        # Yaklaşım 3: Geleneksel (artificial) yöntem - artık önerilmiyor
        print("⚠️ Uyarı: Artificial sequence yöntemi kullanılıyor - temporal yapı bozulabilir")
        sequence_length = 10
        features_per_timestep = n_features // sequence_length
        
        if features_per_timestep == 0:
            features_per_timestep = 1
            sequence_length = min(sequence_length, n_features)
        
        X_seq = np.zeros((n_samples, sequence_length, features_per_timestep))
        
        for i in range(n_samples):
            for t in range(sequence_length):
                start_idx = t * features_per_timestep
                end_idx = min(start_idx + features_per_timestep, n_features)
                
                if start_idx < n_features:
                    X_seq[i, t, :end_idx-start_idx] = X[i, start_idx:end_idx]
    
    # PyTorch tensörlerine dönüştürme
    X_tensor = torch.FloatTensor(X_seq)
    y_tensor = torch.LongTensor(y)
    
    return X_tensor, y_tensor

# Temporal sequence yaklaşımını seç
sequence_approach = 'grouped'  # 'grouped', 'individual', veya 'artificial'

print(f"\n🎵 Temporal Audio Feature Organization ile Sequence Oluşturma")
print(f"Seçilen yaklaşım: {sequence_approach}")
print(f"Bu yaklaşım gerçek audio feature temporal yapısını korur!\n")

# Ölçeklenmiş verileri temporal forma dönüştürme
X_train_seq, y_train_tensor = create_temporal_sequence_data(X_train_scaled, y_train_bal, feature_names, sequence_approach)
X_val_seq, y_val_tensor = create_temporal_sequence_data(X_val_scaled, y_val, feature_names, sequence_approach)
X_test_seq, y_test_tensor = create_temporal_sequence_data(X_test_scaled, y_test, feature_names, sequence_approach)

print(f"\n📊 Final Sequence Boyutları:")
print(f"Eğitim veri boyutu: {X_train_seq.shape}")
print(f"Doğrulama veri boyutu: {X_val_seq.shape}")
print(f"Test veri boyutu: {X_test_seq.shape}")

# PyTorch DataLoader oluşturma
batch_size = 512
train_dataset = TensorDataset(X_train_seq, y_train_tensor)
val_dataset = TensorDataset(X_val_seq, y_val_tensor)
test_dataset = TensorDataset(X_test_seq, y_test_tensor)

train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=False)
test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)

print(f"\n✅ Temporal Audio Sequence DataLoaders hazır!")
print(f"🎯 Artık LSTM gerçek audio feature temporal patterns öğrenebilir!")

In [None]:
# Alternatif: Daha İyi Temporal Sequence Yaklaşımı
# Eğer gerçek temporal yapıyı daha iyi korumak istiyorsak:

def create_improved_temporal_data(X, y, feature_names, approach='feature_type_separated'):
    """
    İyileştirilmiş temporal sequence yapısı oluşturur.
    
    Args:
        X: Özellik matrisi
        y: Etiketler  
        feature_names: Özellik isimleri
        approach: 'feature_type_separated' veya 'no_sequence'
    """
    n_samples, n_features = X.shape
    
    if approach == 'feature_type_separated':
        # Her özellik türünü ayrı kanal olarak işle
        # Bu, temporal yapıyı bozmadan özellik türlerini korur
        
        # Özellik kategorilerini bul
        mfcc_indices = [i for i, name in enumerate(feature_names) if 'mfcc' in name.lower()]
        chroma_indices = [i for i, name in enumerate(feature_names) if 'chroma' in name.lower()]
        spectral_indices = [i for i, name in enumerate(feature_names) if any(spec in name.lower() for spec in ['spectral', 'centroid', 'bandwidth', 'contrast', 'rolloff'])]
        other_indices = [i for i in range(len(feature_names)) 
                        if i not in mfcc_indices and i not in chroma_indices and i not in spectral_indices]
        
        # Her kategoriyi ayrı tensor olarak hazırla
        print(f"Feature Type Separated yaklaşımı:")
        print(f"- MFCC: {len(mfcc_indices)} özellik")
        print(f"- Chroma: {len(chroma_indices)} özellik")
        print(f"- Spectral: {len(spectral_indices)} özellik")
        print(f"- Others: {len(other_indices)} özellik")
        
        # En büyük kategori boyutunu bul
        max_features = max(len(mfcc_indices), len(chroma_indices), len(spectral_indices), len(other_indices))
        
        # 4 kanal (feature type) x max_features boyutunda tensor
        X_seq = np.zeros((n_samples, 4, max_features))
        
        # Her kategoriyi ayrı kanala yerleştir
        if len(mfcc_indices) > 0:
            X_seq[:, 0, :len(mfcc_indices)] = X[:, mfcc_indices]
        if len(chroma_indices) > 0:
            X_seq[:, 1, :len(chroma_indices)] = X[:, chroma_indices]
        if len(spectral_indices) > 0:
            X_seq[:, 2, :len(spectral_indices)] = X[:, spectral_indices]
        if len(other_indices) > 0:
            X_seq[:, 3, :len(other_indices)] = X[:, other_indices]
            
        print(f"Output shape: {X_seq.shape} (samples, feature_types, max_features_per_type)")
        
    else:  # 'no_sequence'
        # LSTM'e gerek yok, standart Dense layer yaklaşımı
        # Bu, temporal yapıyı tamamen yok sayar ama performans açısından daha iyi olabilir
        print(f"⚠️ No Sequence yaklaşımı: Temporal yapı tamamen yok sayılıyor")
        X_seq = X.copy()  # Orijinal boyutlarda tut
        print(f"Output shape: {X_seq.shape} (samples, features) - Standard MLP için uygun")
    
    # PyTorch tensors
    X_tensor = torch.FloatTensor(X_seq)
    y_tensor = torch.LongTensor(y)
    
    return X_tensor, y_tensor, approach

print("\n🔧 Alternatif Temporal Yaklaşımlar Hazır!")
print("Seçenekler:")
print("1. 'feature_type_separated' - Her özellik türü ayrı kanal")
print("2. 'no_sequence' - Temporal yapıyı yok say, standard MLP")
print("\nÖnerimiz: Önce 'no_sequence' deneyin, daha sonra 'feature_type_separated' ile karşılaştırın!")

# Performans karşılaştırması için her yaklaşımı hazırla
# Şimdilik mevcut 'grouped' yaklaşımını kullanıyoruz

## LSTM Model Tanımı ve Eğitimi

Aşağıda müzik türü sınıflandırması için bir LSTM (Long Short-Term Memory) ağı tanımlıyoruz. LSTM'ler, müzik gibi sıralı verilerde başarılı olan bir derin öğrenme mimarisidir.

Model, LSTM katmanlarından sonra bir **attention mekanizması** içerir. Bu mekanizma, modelin yapay olarak oluşturulan zaman adımlarının hangilerinin daha bilgilendirici olduğunu öğrenmesine yardımcı olur ve her zaman adımına farklı ağırlıklar vererek daha etkili bir özellik kombinasyonu oluşturur.

In [None]:
# Attention mekanizması sınıfı
class AttentionLayer(nn.Module):
    def __init__(self, hidden_size):
        super(AttentionLayer, self).__init__()
        self.hidden_size = hidden_size
        
        # Attention ağırlıklarını hesaplamak için linear katmanlar
        self.attention_linear = nn.Linear(hidden_size, hidden_size)
        self.context_vector = nn.Linear(hidden_size, 1, bias=False)
        
    def forward(self, lstm_outputs):
        # lstm_outputs şekli: (batch_size, sequence_length, hidden_size)
        
        # Her zaman adımı için attention skorları hesapla
        attention_weights = self.attention_linear(lstm_outputs)  # (batch_size, seq_len, hidden_size)
        attention_weights = torch.tanh(attention_weights)
        attention_scores = self.context_vector(attention_weights)  # (batch_size, seq_len, 1)
        attention_scores = attention_scores.squeeze(2)  # (batch_size, seq_len)
        
        # Softmax ile normalize et
        attention_weights = torch.softmax(attention_scores, dim=1)  # (batch_size, seq_len)
        
        # Weighted sum hesapla
        # attention_weights: (batch_size, seq_len) -> (batch_size, seq_len, 1)
        attention_weights = attention_weights.unsqueeze(2)
        
        # Weighted combination of LSTM outputs
        attended_output = torch.sum(lstm_outputs * attention_weights, dim=1)  # (batch_size, hidden_size)
        
        return attended_output, attention_weights.squeeze(2)

# Bidirectional LSTM model sınıfını tanımlama (Attention ile)
class MusicGenreLSTM(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, num_classes, dropout=0.3, bidirectional=True):
        super(MusicGenreLSTM, self).__init__()
        
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.bidirectional = bidirectional
        
        # Bidirectional LSTM katmanları
        self.lstm = nn.LSTM(
            input_size=input_size, 
            hidden_size=hidden_size, 
            num_layers=num_layers, 
            batch_first=True,
            dropout=dropout if num_layers > 1 else 0,
            bidirectional=bidirectional
        )
        
        # Bidirectional LSTM çıkış boyutunu hesapla
        lstm_output_size = hidden_size * 2 if bidirectional else hidden_size
        
        # Attention katmanı (bidirectional output için)
        self.attention = AttentionLayer(lstm_output_size)
        
        # Batch normalization
        self.batch_norm = nn.BatchNorm1d(lstm_output_size)
        
        # Dropout katmanı
        self.dropout = nn.Dropout(dropout)
        
        # Tam bağlantılı katmanlar
        self.fc1 = nn.Linear(lstm_output_size, 128)  # İlk tam bağlantılı katman
        self.fc2 = nn.Linear(128, num_classes)
        
        # Aktivasyon fonksiyonları
        self.relu = nn.ReLU()
        
    def forward(self, x):
        # Bidirectional LSTM katmanından geçirme
        # x şekli: (batch_size, sequence_length, input_size)
        lstm_out, _ = self.lstm(x)
        
        # lstm_out şekli: (batch_size, sequence_length, hidden_size * 2) for bidirectional
        # veya (batch_size, sequence_length, hidden_size) for unidirectional
        
        # Attention mekanizması uygula
        attended_output, attention_weights = self.attention(lstm_out)
        
        # Batch normalization
        batch_norm_out = self.batch_norm(attended_output)
        
        # İlk tam bağlantılı katman
        fc1_out = self.fc1(batch_norm_out)
        fc1_out = self.relu(fc1_out)
        fc1_out = self.dropout(fc1_out)
        
        # İkinci tam bağlantılı katman (çıkış katmanı)
        out = self.fc2(fc1_out)
        
        return out

# Learning Rate Warmup Scheduler
class WarmupScheduler:
    def __init__(self, optimizer, warmup_epochs, max_lr, min_lr=1e-7):
        self.optimizer = optimizer
        self.warmup_epochs = warmup_epochs
        self.max_lr = max_lr
        self.min_lr = min_lr
        self.current_epoch = 0
        
    def step(self):
        if self.current_epoch < self.warmup_epochs:
            # Linear warmup
            lr = self.min_lr + (self.max_lr - self.min_lr) * (self.current_epoch / self.warmup_epochs)
            for param_group in self.optimizer.param_groups:
                param_group['lr'] = lr
        self.current_epoch += 1
        
    def get_lr(self):
        return self.optimizer.param_groups[0]['lr']

# Model parametreleri
input_size = X_train_seq.shape[2]  # Bir zaman adımındaki özellik sayısı
hidden_size = 64  # LSTM gizli katman boyutu
num_layers = 2  # LSTM katman sayısı
num_classes = len(le.classes_)  # Sınıf sayısı
dropout = 0.3
bidirectional = True  # Bidirectional LSTM kullan

# GPU kullanılabilir mi kontrol et
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f"Kullanılan cihaz: {device}")

# Model oluşturma
model = MusicGenreLSTM(input_size, hidden_size, num_layers, num_classes, dropout, bidirectional).to(device)
print(f"\nModel yapısı (Bidirectional: {bidirectional}):")
print(model)

# Model parametrelerinin sayısını hesapla
total_params = sum(p.numel() for p in model.parameters())
trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)
print(f"\nToplam parametre sayısı: {total_params:,}")
print(f"Eğitilebilir parametre sayısı: {trainable_params:,}")

# Gelişmiş Learning Rate Ayarları
initial_lr = 0.0001
max_lr = 0.01  # Maksimum öğrenme oranı
min_lr = 1e-6  # Minimum öğrenme oranı
warmup_epochs = 3  # İlk 3 epoch'ta yavaşça arttır

# Kayıp fonksiyonu ve optimize edici tanımlama
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=min_lr)  # Düşük lr ile başla

# Çoklu scheduler sistemi
# 1. Warmup scheduler - İlk birkaç epoch'ta learning rate'i yavaşça arttırır
warmup_scheduler = WarmupScheduler(optimizer, warmup_epochs=warmup_epochs, max_lr=max_lr, min_lr=min_lr)

# 2. ReduceLROnPlateau - Validation loss plateau'ya ulaştığında LR'yi azaltır
reduce_scheduler = optim.lr_scheduler.ReduceLROnPlateau(
    optimizer, mode='min', factor=0.5, patience=3, min_lr=min_lr
)

# 3. CosineAnnealing - Cosine fonksiyonu ile LR'yi düzenli olarak değiştirir
cosine_scheduler = optim.lr_scheduler.CosineAnnealingLR(
    optimizer, T_max=20, eta_min=min_lr
)

print(f"\nLearning Rate Ayarları:")
print(f"Başlangıç LR: {min_lr}")
print(f"Maksimum LR: {max_lr}")
print(f"Minimum LR: {min_lr}")
print(f"Warmup Epochs: {warmup_epochs}")

# Gelişmiş eğitim fonksiyonu
def train_model_with_advanced_lr(model, train_loader, val_loader, criterion, optimizer, 
                                warmup_scheduler, reduce_scheduler, cosine_scheduler,
                                num_epochs=50, early_stopping_patience=3, 
                                min_improvement_threshold=0.025, use_cosine_after_warmup=True):
    """
    Gelişmiş learning rate scheduling ile model eğitimi
    """
    # Ölçüm değerlerini saklayacak listeler
    train_losses = []
    val_losses = []
    train_accs = []
    val_accs = []
    learning_rates = []  # LR geçmişini takip et
    
    # En iyi doğrulama kaybını ve modeli saklama
    best_val_loss = float('inf')
    best_model = None
    
    # Erken durdurma için sayaç
    early_stopping_counter = 0
    
    print("\n=== Gelişmiş Learning Rate Scheduling ile Eğitim Başlıyor ===")
    
    for epoch in range(num_epochs):
        # Learning Rate Scheduling
        current_lr = optimizer.param_groups[0]['lr']
        
        if epoch < warmup_scheduler.warmup_epochs:
            # Warmup phase
            warmup_scheduler.step()
            schedule_info = f"Warmup Phase (Epoch {epoch+1}/{warmup_scheduler.warmup_epochs})"
        elif use_cosine_after_warmup and epoch >= warmup_scheduler.warmup_epochs:
            # Cosine annealing after warmup
            cosine_scheduler.step()
            schedule_info = "Cosine Annealing"
        else:
            schedule_info = "ReduceLROnPlateau (will be applied after validation)"
        
        new_lr = optimizer.param_groups[0]['lr']
        learning_rates.append(new_lr)
        
        # Eğitim modu
        model.train()
        
        train_loss = 0.0
        train_correct = 0
        train_total = 0
        
        for inputs, labels in train_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            
            # Gradyanları sıfırla
            optimizer.zero_grad()
            
            # İleri geçiş
            outputs = model(inputs)
            loss = criterion(outputs, labels)
            
            # Geri yayılım ve optimize etme
            loss.backward()
            
            # Gradient clipping (exploding gradient problemini önler)
            torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)
            
            optimizer.step()
            
            # İstatistikleri güncelle
            train_loss += loss.item() * inputs.size(0)
            _, predicted = torch.max(outputs.data, 1)
            train_total += labels.size(0)
            train_correct += (predicted == labels).sum().item()
        
        # Doğrulama modu
        model.eval()
        
        val_loss = 0.0
        val_correct = 0
        val_total = 0
        
        with torch.no_grad():
            for inputs, labels in val_loader:
                inputs, labels = inputs.to(device), labels.to(device)
                
                outputs = model(inputs)
                loss = criterion(outputs, labels)
                
                val_loss += loss.item() * inputs.size(0)
                _, predicted = torch.max(outputs.data, 1)
                val_total += labels.size(0)
                val_correct += (predicted == labels).sum().item()
        
        # Epoch sonuçlarını hesapla
        epoch_train_loss = train_loss / len(train_loader.dataset)
        epoch_val_loss = val_loss / len(val_loader.dataset)
        epoch_train_acc = train_correct / train_total
        epoch_val_acc = val_correct / val_total
        
        # ReduceLROnPlateau scheduler'ı warmup sonrası uygula
        if epoch >= warmup_scheduler.warmup_epochs and not use_cosine_after_warmup:
            reduce_scheduler.step(epoch_val_loss)
        
        # Sonuçları sakla
        train_losses.append(epoch_train_loss)
        val_losses.append(epoch_val_loss)
        train_accs.append(epoch_train_acc)
        val_accs.append(epoch_val_acc)
        
        # Eğitim durumunu yazdır
        print(f'Epoch {epoch+1:2d}/{num_epochs} | '
              f'Train Loss: {epoch_train_loss:.4f} | Train Acc: {epoch_train_acc:.4f} | '
              f'Val Loss: {epoch_val_loss:.4f} | Val Acc: {epoch_val_acc:.4f} | '
              f'LR: {new_lr:.2e} | {schedule_info}')
        
        # En iyi modeli sakla ve erken durdurma kontrolü
        improvement = best_val_loss - epoch_val_loss
        
        if epoch_val_loss < best_val_loss:
            if improvement > min_improvement_threshold:
                early_stopping_counter = 0
                improvement_msg = f"✓ Significant improvement: {improvement:.6f}"
            else:
                early_stopping_counter += 1
                improvement_msg = f"⚠ Minor improvement: {improvement:.6f}"
            
            best_val_loss = epoch_val_loss
            best_model = model.state_dict()
            print(f"  {improvement_msg}")
        else:
            early_stopping_counter += 1
            print(f"  ✗ No improvement (counter: {early_stopping_counter}/{early_stopping_patience})")
            
        # Erken durdurma kontrolü
        if early_stopping_counter >= early_stopping_patience:
            print(f'\n🛑 Erken durdurma: {early_stopping_patience} epoch boyunca yeterli iyileşme yok.')
            break
    
    # En iyi model ağırlıklarını yükle
    if best_model is not None:
        model.load_state_dict(best_model)
        print(f"\n✅ En iyi model yüklendi (Val Loss: {best_val_loss:.6f})")
    
    return model, train_losses, val_losses, train_accs, val_accs, learning_rates

# Modeli gelişmiş LR scheduling ile eğit
print("\n🚀 Bidirectional LSTM model eğitimi (Gelişmiş LR Scheduling) başlıyor...")
num_epochs = 50
early_stopping_patience = 3  # Erken durdurma için sabır sayısı
min_improvement_threshold = 0.025  # İyileşme eşiği

try:
    model, train_losses, val_losses, train_accs, val_accs, learning_rates = train_model_with_advanced_lr(
        model, train_loader, val_loader, criterion, optimizer, 
        warmup_scheduler, reduce_scheduler, cosine_scheduler,
        num_epochs=num_epochs, 
        early_stopping_patience=early_stopping_patience,
        min_improvement_threshold=min_improvement_threshold,
        use_cosine_after_warmup=True  # Warmup sonrası cosine annealing kullan
    )
    print("\n🎉 Model eğitimi başarıyla tamamlandı!")
except KeyboardInterrupt:
    print("\n⏹️ Eğitim kullanıcı tarafından durduruldu.")

## Model Değerlendirmesi ve Görselleştirme

Bu bölümde eğitilmiş modeli test veri seti üzerinde değerlendirip, sonuçları görselleştireceğiz.

In [None]:
# Eğitim sonuçlarını görselleştirme
def plot_training_history(train_losses, val_losses, train_accs, val_accs, learning_rates=None):
    if learning_rates is not None:
        plt.figure(figsize=(18, 6))
        
        # Kayıp grafiği
        plt.subplot(1, 3, 1)
        plt.plot(train_losses, label='Eğitim', marker='o', alpha=0.7)
        plt.plot(val_losses, label='Doğrulama', marker='*', alpha=0.7)
        plt.title('Model Kaybı')
        plt.xlabel('Epoch')
        plt.ylabel('Kayıp (Cross-Entropy)')
        plt.legend()
        plt.grid(True, linestyle='--', alpha=0.6)
        
        # Doğruluk grafiği
        plt.subplot(1, 3, 2)
        plt.plot(train_accs, label='Eğitim', marker='o', alpha=0.7)
        plt.plot(val_accs, label='Doğrulama', marker='*', alpha=0.7)
        plt.title('Model Doğruluğu')
        plt.xlabel('Epoch')
        plt.ylabel('Doğruluk')
        plt.legend()
        plt.grid(True, linestyle='--', alpha=0.6)
        
        # Learning Rate grafiği
        plt.subplot(1, 3, 3)
        plt.plot(learning_rates, marker='s', alpha=0.7, color='red')
        plt.title('Learning Rate Değişimi')
        plt.xlabel('Epoch')
        plt.ylabel('Learning Rate')
        plt.yscale('log')  # Log scale for better visualization
        plt.grid(True, linestyle='--', alpha=0.6)
    else:
        plt.figure(figsize=(14, 5))
        
        # Kayıp grafiği
        plt.subplot(1, 2, 1)
        plt.plot(train_losses, label='Eğitim', marker='o')
        plt.plot(val_losses, label='Doğrulama', marker='*')
        plt.title('Model Kaybı')
        plt.xlabel('Epoch')
        plt.ylabel('Kayıp (Cross-Entropy)')
        plt.legend()
        plt.grid(True, linestyle='--', alpha=0.6)
        
        # Doğruluk grafiği
        plt.subplot(1, 2, 2)
        plt.plot(train_accs, label='Eğitim', marker='o')
        plt.plot(val_accs, label='Doğrulama', marker='*')
        plt.title('Model Doğruluğu')
        plt.xlabel('Epoch')
        plt.ylabel('Doğruluk')
        plt.legend()
        plt.grid(True, linestyle='--', alpha=0.6)
    
    plt.tight_layout()
    plt.show()

# Eğitim sonuçlarını görselleştir
try:
    if 'learning_rates' in locals():
        plot_training_history(train_losses, val_losses, train_accs, val_accs, learning_rates)
        
        # Detaylı learning rate analizi
        print(f"\n📊 Learning Rate İstatistikleri:")
        print(f"Başlangıç LR: {learning_rates[0]:.2e}")
        print(f"Maksimum LR: {max(learning_rates):.2e}")
        print(f"Son LR: {learning_rates[-1]:.2e}")
        print(f"Ortalama LR: {np.mean(learning_rates):.2e}")
    else:
        plot_training_history(train_losses, val_losses, train_accs, val_accs)
except NameError:
    print("Eğitim geçmişi bulunamadı. Önce modeli eğitin.")

# Test veri seti üzerinde değerlendirme
def evaluate_model(model, test_loader, device):
    model.eval()
    
    y_true = []
    y_pred = []
    
    with torch.no_grad():
        for inputs, labels in test_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            
            outputs = model(inputs)
            _, predicted = torch.max(outputs.data, 1)
            
            y_true.extend(labels.cpu().numpy())
            y_pred.extend(predicted.cpu().numpy())
    
    # Doğruluk hesapla
    accuracy = np.mean(np.array(y_true) == np.array(y_pred))
    
    # Sonuçları yazdır
    print(f"\n🎯 Test Doğruluğu: {accuracy:.4f}")
    
    # Sınıflandırma raporu
    print("\n📋 Sınıflandırma Raporu:")
    print(classification_report(y_true, y_pred, target_names=le.classes_))
    
    # Karmaşıklık matrisi
    plt.figure(figsize=(12, 10))
    cm = confusion_matrix(y_true, y_pred)
    sns.heatmap(cm, annot=True, fmt="d", cmap="Blues", xticklabels=le.classes_, yticklabels=le.classes_)
    plt.title('Karmaşıklık Matrisi')
    plt.xlabel('Tahmin Edilen Etiketler')
    plt.ylabel('Gerçek Etiketler')
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()
    
    return y_true, y_pred

# Test veri seti üzerinde değerlendir
try:
    y_true, y_pred = evaluate_model(model, test_loader, device)
except NameError:
    print("Model bulunamadı. Önce modeli eğitin.")