# **Train Test Split dengan Cross Validation**

Melakukan 5-fold cross-validation dengan pembagian 70% training dan 30% testing

---

## 1. Import packages

Import modul-modul yang diperlukan untuk pengolahan citra medis, termasuk pembacaan citra dengan `SimpleITK`, manipulasi array dengan `NumPy`, visualisasi dengan `Matplotlib`, dan perhitungan entropy dengan `scipy.stats`

In [None]:
import os
import numpy as np
from sklearn.model_selection import StratifiedKFold

In [None]:
file_path = 'D:/Documents/Kuliah/.SKRIPSI/KLASIFIKASI ALZHEIMER/Coding/Notebook/selected_slice.npz'
base_path = 'D:/Documents/Kuliah/.SKRIPSI/KLASIFIKASI ALZHEIMER/Coding/Notebook'

data_path = os.path.join(base_path, 'Data')
if not os.path.exists(data_path):
    os.makedirs(data_path)

In [None]:
loaded_data = np.load(file_path, allow_pickle=True)
labels = loaded_data.files

kfold = StratifiedKFold(n_splits=5, shuffle=True, random_state=42)

for label in labels:
    # Membuat direktori untuk label di dalam data
    label_data_path = os.path.join(data_path, label)

    # Mengecek dan membuat direktori jika belum ada
    if not os.path.exists(label_data_path):
        os.makedirs(label_data_path)

    # Mengambil data untuk label tersebut
    data_for_label = loaded_data[label]

    # Mendapatkan indeks untuk K-Fold
    for fold, (train_indices, test_indices) in enumerate(kfold.split(data_for_label, np.zeros(len(data_for_label)))):
        # Membuat direktori untuk fold di dalam label_data_path
        fold_path = os.path.join(label_data_path, f'Fold_{fold + 1}')
        os.makedirs(fold_path)

        # Membuat direktori untuk training dan testing
        train_path = os.path.join(fold_path, 'Training')
        test_path = os.path.join(fold_path, 'Testing')
        for path in [train_path, test_path]:
            os.makedirs(path)

        # Split data berdasarkan indeks
        train_data = data_for_label[train_indices]
        test_data = data_for_label[test_indices]

        # Pindahkan file ke dalam direktori training
        for i, slice_data in enumerate(train_data):
            file_name = f'slice{i + 1}.npy'
            file_path = os.path.join(train_path, file_name)
            np.save(file_path, slice_data)

        # Pindahkan file ke dalam direktori testing
        for i, slice_data in enumerate(test_data):
            file_name = f'slice{i + 1}.npy'
            file_path = os.path.join(test_path, file_name)
            np.save(file_path, slice_data)

In [None]:
for label in labels:
    # Mengambil data untuk label tersebut
    data_for_label = loaded_data[label]

    print(f"Label: {label}, Jumlah data: {len(data_for_label)}")

    # Pengecekan ukuran setiap data
    for i, slice_data in enumerate(data_for_label):
        print(f"Data ke-{i + 1}, Ukuran (Shape): {slice_data.shape}")