# RNN Model Test ve Değerlendirme
Bu notebook, eğitim aşamasında kaydedilen **RNN (LSTM)** modelini yükleyerek, ayrılmış olan **test verileri** üzerinde performansını ölçer.

Amaç, modelin daha önce hiç görmediği veriler üzerindeki genelleme yeteneğini ve nihai başarımını doğrulamaktır. İşlem adımları:
1. Gerekli kütüphaneler yüklenir.
2. Değerlendirme fonksiyonu tanımlanır.
3. Veri seti (`CREMA-D` veya `EMO-DB`) için kaydedilmiş model ve test verileri (`.pth`, `.npy`, `.pkl`) yüklenir.
4. Modelin test performansı (Accuracy, F1-Score, Precision, Recall, Confusion Matrix) hesaplanır ve görselleştirilir.

## 1. Kütüphanelerin Yüklenmesi ve Ayarlar

In [None]:
import os
import numpy as np
import torch
import torch.nn as nn
from sklearn.metrics import accuracy_score, f1_score, precision_score, recall_score, confusion_matrix, classification_report
import matplotlib.pyplot as plt
import seaborn as sns
import joblib
import warnings
warnings.filterwarnings('ignore')
%matplotlib inline

# Google Drive bağlantısı (lokal ortamda kapatılmalı)
# from google.colab import drive
# drive.mount('/content/drive')
# os.chdir('/content/drive/MyDrive/AudioEmotionDetection')

## 2. RNN Modeli Tanımlama

In [None]:
class RNNModel(nn.Module):
    def __init__(self, input_size, hidden_size=64, num_layers=2, num_classes=6):
        super(RNNModel, self).__init__()
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True, dropout=0.3)
        self.fc = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
        out, _ = self.lstm(x, (h0, c0))
        out = self.fc(out[:, -1, :])
        return out

## 3. Veri Seti Sınıfı

In [None]:
class AudioDataset(torch.utils.data.Dataset):
    def __init__(self, features, labels):
        self.features = features
        self.labels = labels

    def __len__(self):
        return len(self.features)

    def __getitem__(self, idx):
        return torch.tensor(self.features[idx], dtype=torch.float32), torch.tensor(self.labels[idx], dtype=torch.long)

## 4. Model Değerlendirme Fonksiyonu

In [None]:
def evaluate_model(model, test_loader, model_name, dataset_name, le, device='cuda' if torch.cuda.is_available() else 'cpu'):
    """Modeli test verisi üzerinde değerlendirir ve sonuçları görselleştirir."""
    model = model.to(device)
    model.eval()
    test_preds, test_labels = [], []
    with torch.no_grad():
        for inputs, labels in test_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            outputs = model(inputs)
            test_preds.extend(torch.argmax(outputs, dim=1).cpu().numpy())
            test_labels.extend(labels.cpu().numpy())

    # Metrikleri hesapla
    accuracy = accuracy_score(test_labels, test_preds)
    f1 = f1_score(test_labels, test_preds, average='weighted')
    precision = precision_score(test_labels, test_preds, average='weighted')
    recall = recall_score(test_labels, test_preds, average='weighted')
    cm = confusion_matrix(test_labels, test_preds)

    # Sonuçları yazdır
    print(f'--- {model_name} ({dataset_name}) TEST SONUÇLARI ---')
    print(f'Accuracy: {accuracy:.4f}')
    print(f'Precision: {precision:.4f}')
    print(f'Recall: {recall:.4f}')
    print(f'F1-Score: {f1:.4f}')
    print(f'\nSınıf Bazlı Performans:\n{classification_report(test_labels, test_preds, target_names=le.classes_)}')

    # Karışıklık Matrisini çizdir
    plt.figure(figsize=(8, 6))
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=le.classes_, yticklabels=le.classes_)
    plt.title(f'{model_name} ({dataset_name}) Test Karışıklık Matrisi')
    plt.xlabel('Tahmin Edilen')
    plt.ylabel('Gerçek')
    plt.show()

    return accuracy, f1, precision, recall

## 5. Test Verisi ile Modelin Değerlendirilmesi

In [None]:
datasets = ['CREMA-D']  # EMO-DB eklenebilir
test_results = []

for dataset_name in datasets:
    print(f"\n{'='*20} {dataset_name} TEST AŞAMASI {'='*20}")
    try:
        # Kaydedilmiş verileri ve modeli yükle
        X_test = np.load(f'X_test_{dataset_name}.npy')
        y_test = np.load(f'y_test_{dataset_name}.npy')
        le = joblib.load(f'label_encoder_{dataset_name}.pkl')

        # RNN modelini başlat
        model = RNNModel(input_size=X_test.shape[1], hidden_size=64, num_layers=2, num_classes=len(le.classes_))
        model.load_state_dict(torch.load(f'rnn_model_{dataset_name}.pth'))

        # Test veri setini hazırla
        test_dataset = AudioDataset(X_test, y_test)
        test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=32, shuffle=False)

        # Modeli değerlendir
        rnn_acc, rnn_f1, rnn_pre, rnn_rec = evaluate_model(model, test_loader, 'RNN', dataset_name, le)

        # Sonuçları kaydet
        test_results.append({
            'Model': 'RNN',
            'Accuracy': rnn_acc,
            'F1-Score': rnn_f1,
            'Precision': rnn_pre,
            'Recall': rnn_rec,
            'Dataset': dataset_name
        })
    except FileNotFoundError as e:
        print(f'HATA: {dataset_name} için gerekli dosyalar bulunamadı. Lütfen eğitim notebookunun çalıştığından emin olun.')
        print(f'Eksik dosya: {e.filename}')

# Sonuçları görselleştir
if test_results:
    results_df = pd.DataFrame(test_results)

    # Doğruluk Karşılaştırması
    plt.figure(figsize=(8, 6))
    sns.barplot(x='Model', y='Accuracy', hue='Dataset', data=results_df, palette='viridis')
    plt.title('RNN Test Verisi Üzerindeki Performans (Doğruluk)')
    plt.ylabel('Doğruluk Oranı')
    plt.xlabel('Model')
    plt.legend(title='Veri Seti')
    plt.ylim(0, 1.0)
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    plt.show()

    # F1-Skoru Karşılaştırması
    plt.figure(figsize=(8, 6))
    sns.barplot(x='Model', y='F1-Score', hue='Dataset', data=results_df, palette='plasma')
    plt.title('RNN Test Verisi Üzerindeki Performans (F1-Skoru)')
    plt.ylabel('F1-Skoru (Ağırlıklı)')
    plt.xlabel('Model')
    plt.legend(title='Veri Seti')
    plt.ylim(0, 1.0)
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    plt.show()
else:
    print("Karşılaştırılacak test sonucu bulunamadı. Lütfen eğitim notebookunun çalıştığından emin olun.")